Посоны, подскажите плиз, как бы мне с сайта дернуть инфу в текстовый список?
Дергать видимо надо java скриптами, но не знаю пока, с какой стороны подступиться.
Подробности инсайд

Linux Nix Web Development - http://linuxoids.org/ Image #1419119, 44.1 KB

Tagged with →  

32 Responses to Посоны, подскажите плиз, как бы мне с сайта дернуть инфу в текстовый список?

  1. Remoff:

    Сайт с инфой http://www.turfwarsdb.com/Codes/get/
    тестовая рега для входа
    логин блогa
    пароль 666777

    Фильтровать на даты за пару дней.

    Хочется:
    1. стырить все коды в список вида (и далее в файл)

    MARYJANE
    DEVIL
    FORK
    SNAFU

    2. При отборе учесть число Good и Bad, дергать только те записи, где Good > Bad
    3. После тырения ткнуть автоматом кнопку Good для пометки записи как стыренной

  2. LeSnode:

    Анус себе дёрни.

  3. Remoff:

    это к какому пункту из трех указанных?

  4. AmtEkb:

    А почему нельзя просто пропарсить скаченную html-ку, запоминая попутно ссылки, которые должны быть загружены по нажатию кнопки «Good»?
    Там же все данные прямо в html-ке приходят.

    Кстати, нажатия — это обычные POST-запросы на http://www.turfwarsdb.com/Codes/flag/out
    Например, для MARYJANE нажатие кнопки Good вызовет POST-запрос на http://www.turfwarsdb.com/Codes/flag/out

  5. Remoff:

    я просто с этим не общался и был бы интересен пример кода, который делает подобное. А дальше я сам докручу до ума.
    Сейчас я банально не в курсе, как например выдернуть все текстовки списком, как программно кликнуть этот POST запрос итп.

    Парсить хочу именно с сайта, потому что хочется сделать в 1-2 клика, а не кучу телодвижений «Save as», enter, открыть как, парсить итп

  6. AmtEkb:

    ууу… так тебе нужно парсер написать и сюда код выложить 🙂
    Извини, так глубоко и подробно у меня времени нет объяснять, работы много.

    Текстовки выдёргивать легко регуляркой, главное её правильно написать. Твои данные — это повторяющиеся блоки текста, с меняющимися значениями внутри. Ничего сложного.
    Программно кликнуть POST можно по-разному, плюс ещё зависит от языка программирования. Можно, чтоб не париться, сделать что-нибудь типа exec(«wget …»);

  7. RARre:

    java скрипты [x]

  8. Remoff:

    javascript:var iu=document.getElementsByClassName(‘inne rcodetable’); console.log(document);var s=»;for(var i=0;i

  9. Remoff:

    парсер лох

    Почему моя конструкция возвращает мне вместо списка имен лишь undefined, undefined, undefined, undefined, undefined, undefined,?

    javascript: var iu=document.getElementsByClassName(‘inne rcodetable’);
    console.log(document);
    var s=»;
    for(var i=0;i

  10. Remoff:

    да ебанись этот парсер

    javascript:
    var iu=document.getElementsByClassName(‘inne rcodetable’);
    console.log(document);
    var s=»;for(var i=0;i МЕНЬШЕ iu.length;i++){console.log(iu[i]);
    s+=iu[i].text+’,’};s=s.substr(0,s.length -1);

  11. Oveer:

    ну то что ты хочеш напсать должно выглядеть как-то так $.map($(‘.innercodetable’), function(e){return $(e).text().replace(/s/g, »)}).join(‘,’)

  12. Remoff:

    билят. А по человечески это нельзя написать? Без регэкспов

  13. Kaeer:

    А че без регекспов-то?

  14. Kaeer:

    Вот тебе: http://pastebin.com/b4wSXx2E, дальше сам без регекспов парси goodbadobj.
    Good тыкнуть, разберешься как?

  15. Kaeer:

    Вот с ненавистными регекспами: http://pastebin.com/gtWq18qd

  16. Remoff:

    не разберусь, я ж с этим не имел дела )

  17. Remoff:

    а где бы глянуть содержимое goodbadobj? Дебаггер есть под джава скрипты? А то я сейчас через голимый гуглхром редактирую и смотрю

  18. Kaeer:

    Ябать как я давно не писал на жсе, держи: http://pastebin.com/XLhCCANQ

  19. Kaeer:

    выполняй в консоле.

  20. Kaeer:

    В кратце -бежит, получает все именя, все беды и гуды (без регекспов), все которые good > bad, пушает в массив array, и тыкает для них Good. При выходе из цикла получаешь массив объектов жс (называется array).

  21. Remoff:

    асенкс вери мач! А как бы потом все это выгрузить в список в файл через перенос строки? А то склейку через «rn» оно у меня игнорирует

  22. Kaeer:

    насчет сохранить — не получится из браузера жаваскриптом файл сохранить. Можно открыть попап с результатами и его уже сохранить, примерно так: http://pastebin.com/k4d1164y но высока вероятность, что браузер заблокирует попап. Если тебе не слишком важно оставаться на текущей странице, то замени window.open на location.href=»data:text/plain,»+encodeU RIComponent(array.join(«rn»))
    Как-то так.

  23. Remoff:

    отличненько! )
    Спасибо большое!

  24. Kaeer:

    Да говно вопрос, как говорится.

  25. XbiNo:

    Ставишь фаербаг на лису. У этих ребят уже предусмотрительно есть jQuery. Читаешь страницу мануала selectors. Вот набросал кода немножко с комментариями. Код нужно скопировать в фаербаг и запустить. Нативный яваскрипт без жквери в данном случае будет работать быстрее меньше чем на 5мс (у меня столько заняло всё суммарное время исполнения с кликами). http://pastebin.com/yWF45hfT

  26. Cap_68kr:

    на всякий случай: чтоб не колупаться каждый раз с файербагом и всем остальным, сделай себе один раз букмарклет по этой технологии

    http://benalman.com/projects/run-jquery-

    когда мне надо было, я с грехом пополам намутил себе такую ботву: http://pastebin.com/fZqcc0he

  27. XbiNo:

    фаербаг нужен чтоб запускать скрипты, с парой плугинов он начинает радостно подсвечивать код и автодополнять.

  28. XbiNo:

    без регэкспов!

Добавить комментарий