[Delphi]Вопрос про парсинг HRML пайпал

Dager315

Carder
Messages
68
Reputation
1
Reaction score
3
Points
8
Сабж. у кого есть примеры работы с парсингом HTML, если есть примеры работы с парсингом палки, будьте любезны, скиньте в тему или в пм, я буду вам очень благодарен!)
 

cyber

Professional
Messages
545
Reputation
99
Reaction score
185
Points
43
что именно парсить то нужно ?

p.s. это вопрос из серии: иди туда не знаю куда, возьми то не знаю что ?
 

Dager315

Carder
Messages
68
Reputation
1
Reaction score
3
Points
8
Нужно имя, адрес, вериф или нет, тип ака(перс, беизнес, премьер), баланс, наличие карты, банк ака.
 

Glot

RIPPER
Messages
183
Reputation
33
Reaction score
55
Points
28
Нужно имя, адрес, вериф или нет, тип ака(перс, беизнес, премьер), баланс, наличие карты, банк ака.

ну тк обширно) Юзай Pas и Copy построчно, т.е грузишь в стринг лист код и построчно юзаешь функции. Мож кто то предложит другой вариант?
 

Dager315

Carder
Messages
68
Reputation
1
Reaction score
3
Points
8
ну тк обширно) Юзай Pas и Copy построчно, т.е грузишь в стринг лист код и построчно юзаешь функции. Мож кто то предложит другой вариант?

Z юзаю delete и pos.Но дело в том что почему то у меня они записываются с левыми символами, вот я и спрашиваю есть ли у кого исходник что бы не искать теги для вывода инфы.

Кусок кода который должен выдернуть ссылку на вход с главной страницы.
Code:
PPlink:=idhttp1.get('https://www.paypal.com/pt/');
Delete(pplink,1,pos('<form method="post" id="rosetta" class="rosetta" action=",pplink)+length('"><fieldset><legend>Member Log ')-1);
Delete(pplink,pos('">',pplink),length(pplink));
 
Last edited:

cyber

Professional
Messages
545
Reputation
99
Reaction score
185
Points
43
для того чтобы парсить страницу с данными холдера нужно послать около 5 запросов только чтобы войти в палку. Если же ты авторизоваться не можешь то думаю бесполезно тебе давать какой-либо код ;)
 

Dager315

Carder
Messages
68
Reputation
1
Reaction score
3
Points
8
Я просто отправляю пост запрос и он нормально входит, только надо чуть по лучше продумать алгоритм проверки входа, а то там иногда перекидывает не в сам акк.
 
Last edited:

Dager315

Carder
Messages
68
Reputation
1
Reaction score
3
Points
8
Все реализовано, кибер был прав, запросов я отправляю несколько, но теперь та же проблема с парсингом, copy и pos не помогают, почему то не могу с ними совладать, может я как то не так сохраняю файл, делаю все через мемо, тоесть добавляю код страницы в мемо и ищу его там, не получается, может что посоветуете?
 

Passion

VIP member
Messages
562
Reputation
92
Reaction score
124
Points
43
Попробуй так, только все на словах, в делпфи далёк, на другом языке делал подобное.
Открываешь исходный код, удаляешь все до определённого тега, потом идет слово какое-то, после него еще тег, удаляешь второй тег после слова и получаешь результат, и так весь текст. Тем более парсинг можно устроить так же по словам Balance, Status и т.д. Просто нужно удалять не нужное, и выбирать самое главное.
Подведем итог:
1. Открываешь код страницы программно.
2. Выбираешь все нужное путём удаления теста до тегов и тег тоже дел.
3. Вычищаешь весь мусор который может попасть.
4. Записываешь результат построчно в файл.
Вот и весь парсинг-) Потренируйся на куске исходного кода, а потом весь алгоритм соберёшь.
 

cyber

Professional
Messages
545
Reputation
99
Reaction score
185
Points
43
Все реализовано, кибер был прав, запросов я отправляю несколько, но теперь та же проблема с парсингом, copy и pos не помогают, почему то не могу с ними совладать, может я как то не так сохраняю файл, делаю все через мемо, тоесть добавляю код страницы в мемо и ищу его там, не получается, может что посоветуете?

смотри инфу по функциям copy, pos, delete, без них имхо не справиться. В мемо не нужно добавлять, создай обычную переменную типа string, туда скидывай содержание страницы и вырезай/копируй оттуда нужные параметры

правильно Passion говорит, нужно по определенным ключевым словам работать, скажем нужно вырвать баланс, соответственно ищем его в коде и отрезаем не нужное или наоборот копируем из общей массы то что нужно
 

Dager315

Carder
Messages
68
Reputation
1
Reaction score
3
Points
8
Через стринг переменную тоже пробовал, почему то в showmesaage вылазит или один левый символ как правило D, или первая строка страницы.

word:=Copy(page1, pos('paypal balance:',page1)+46,pos('paypal balance:',page1)+67) ;
showmessage(word);

Вот код, почему то выводит первую строку в хтмл.
 

cyber

Professional
Messages
545
Reputation
99
Reaction score
185
Points
43
paypal balance:
а этот текст вообще встречается в палке ? Ты парси не то, как тебе хотелось бы парсить, а по реальному коду
 

Dager315

Carder
Messages
68
Reputation
1
Reaction score
3
Points
8
paypal balance:
а этот текст вообще встречается в палке ? Ты парси не то, как тебе хотелось бы парсить, а по реальному коду

Само собой уж, я же не дурак))

Вот кусок искодного кода с балансом
Code:
</div><div id="messageBox"></div><div id="main"><div class="layout2c"><div class="col first"><div class="box multi"><div class="head"><h3>PayPal balance: <span class="balance">
<!--googleoff: all-->
$0.00 USD
<!--googleon: all-->
 

cyber

Professional
Messages
545
Reputation
99
Reaction score
185
Points
43
pos чувствителен к регистру поэтому нужно так
word:=Copy(page1, pos('PayPal balance:',page1)+46,pos('PayPal balance:',page1)+67) ;
showmessage(word);

по идее ;)
 
  • Like
Reactions: Dager315

    Dager315

    Points: 1
    За отзывчивость!!)

Dager315

Carder
Messages
68
Reputation
1
Reaction score
3
Points
8
pos чувствителен к регистру поэтому нужно так
word:=Copy(page1, pos('PayPal balance:',page1)+46,pos('PayPal balance:',page1)+67) ;
showmessage(word);

по идее ;)

Спасибо тебе, очень помог.
 
Top