Автор Тема: A-Parser 1.1 - продвинутый парсер ПС, кейвордов, контента, показателей, 70+ парс  (Прочитано 11761 раз)

04 Сентябрь, 2018, 11:37:10
Ответ #30

Оффлайн A-Parser Support

  • Чайник
  • **
  • Сообщений: 61
  • Репутация: 0
  • OS: Windows NT 10.0 Windows NT 10.0
  • Browser: Chrome 68.0.3440.106 Chrome 68.0.3440.106
    • Просмотр профиля
1.2.292 - новый парсер Яндекс ИКС, улучшения в работе с кодировками, оптимизации встроенных парсеров

Улучшения

* Добавлен парсер SE::Yandex::SQI - парсер Индекса качества сайта (Яндекс ИКС)
* Оптимизирована работа Очереди заданий
* Добавлена поддержка множества экзотических кодировок китайского языка
* Добавлена опция Save as UTF-8 with BOM, которая решает проблему определения кодировки при открытии сформированного CSV в Excel
* SE::Youtube полностью переписан с использованием современного юзерагента
* SE::AOL::Suggest оптимизирован и переписан на JavaScript
* Улучшена работа SE::Google,SE::Google::Modern, Rank::MajesticSEO,SE::Bing,Shop::Amazon

Исправления в связи с изменениями в выдаче

* Исправлен парсинг мобильной выдачи в SE::Google::Modern
* Исправлено определение опечаток в SE::Google и SE::Google::Modern
* Исправлена ситуация, при которой в SE::Google::Modern в сниппеты могли попадать ненужные ссылки
* Исправлен парсинг рекламы в SE::Yandex
* Исправлен парсинг количества результатов в SE::Youtube
*  Удален SE::Yandex::TIC, т.к. больше не актуален
*  Исправлен Shop::Yandex::Market,SE::DuckDuckGo,SE::AOL::Suggest

Исправления

* Исправлена работа Net::Whois для некоторых доменных зон
* Исправлена ошибка, при которой не импортировался пресет, если не установлены модули, используемые в нем
* Исправлена кодировка при использовании fs.readdirSync в JS парсерах

Форум вебмастеров


14 Сентябрь, 2018, 11:07:33
Ответ #31

Оффлайн A-Parser Support

  • Чайник
  • **
  • Сообщений: 61
  • Репутация: 0
  • OS: Windows NT 10.0 Windows NT 10.0
  • Browser: Chrome 69.0.3497.92 Chrome 69.0.3497.92
    • Просмотр профиля
Сборник статей #5: собственный канал в Telegram и массовое добавление товаров в OpenCart
В 5-м сборнике статей на реальном примере будет показано, как создать свой канал в Телеграме и полностью автоматизировать его наполнение контентом. Также мы продолжаем цикл статей по работе с OpenCart и во 2-й части будет рассмотрен вопрос массового добавления товаров. Как обычно, в каждой статье приложены готовые JS парсеры, используя которые, можно на реальных примерах изучить описанные методы и поэксперементировать с ними. Поехали!

Полноценный Telegram канал на базе A-Parser
В этой статье будет описан способ создания полноценного канала в Telegram c автоматизированным сбором контента и постингом сообщений через заданные интервалы. И конечно, все это на базе A-Parser. Все подробности, а также готовые пресеты - по ссылке выше.


Работаем с OpenCart. Часть 2. Массовое добавление товаров
Мы продолжаем цикл статей о заливке товаров в интернет-магазин на базе OpenCart. Во второй части будет рассмотрено массовое добавление товара. Подробности, а также пример готового парсера - по ссылке выше.


Если вы хотите, чтобы мы более подробно раскрыли какой-то функционал парсера, у вас есть идеи для новых статей или вы желаете поделиться собственным опытом использования A-Parser (за небольшие плюшки :) ) - отписывайтесь здесь.

Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.

Предыдущие сборники статей

25 Сентябрь, 2018, 11:06:07
Ответ #32

Оффлайн A-Parser Support

  • Чайник
  • **
  • Сообщений: 61
  • Репутация: 0
  • OS: Windows NT 10.0 Windows NT 10.0
  • Browser: Chrome 69.0.3497.100 Chrome 69.0.3497.100
    • Просмотр профиля
Видео урок: Массовое добавление товаров в OpenCart
Данный парсер является примером для разработки парсера работающего с OpenCart. Решение демонстрирует возможность сбора данных о товарах из стороннего сайта и заливку их на собственный сайт на базе OpenCart через API.

В этом уроке рассмотрены:
  • парсинг товаров из интернет-магазина
  • авторизация в OpenCart
  • работа с API OpenCart для публикации товаров

Статья и готовый пресет опубликованы в нашем Каталоге: https://a-parser.com/resources/302/

Оставляйте комментарии и подписывайтесь на наш канал на YouTube!

05 Октябрь, 2018, 13:14:19
Ответ #33

Оффлайн A-Parser Support

  • Чайник
  • **
  • Сообщений: 61
  • Репутация: 0
  • OS: Windows NT 10.0 Windows NT 10.0
  • Browser: Chrome 69.0.3497.100 Chrome 69.0.3497.100
    • Просмотр профиля
1.2.319 - новый парсер подсказок Youtube, поддержка модуля MySQL2, множество улучшений и оптимизаций

Улучшения
  • Добавлен новый парсер SE::Youtube::Suggest
  • Добавлена совместимость с модулем mysql2 в JavaScript парсерах
  • В Util::ReCaptcha2 добавлена поддержка сервиса R.I.P.captcha
  • В SE::Bing::Suggest добавлена возможность выбора страны
  • Уменьшено потребление оперативной памяти, а также оптимизирована начальная загрузка, интерфейс теперь открывается быстрее
  • База регионов в SE::Yandex обновлена и значительно увеличена
  • Для всех стандартных парсеров, кроме тех, которые работают на основе Net::HTTP, из настроек убраны Max body size и Use gzip
  • Улучшен Shop::Amazon
Исправления в связи с изменениями в выдаче
Исправления
  • Исправлена работа с прокси при получении каптчи в SE::Yandex::Register
  • В очень редких случаях в SE::Yandex могла возникать ошибка Content mismatch
  • Исправлен Net::Whois при работе с .eu доменами

16 Октябрь, 2018, 10:45:22
Ответ #34

Оффлайн A-Parser Support

  • Чайник
  • **
  • Сообщений: 61
  • Репутация: 0
  • OS: Windows NT 10.0 Windows NT 10.0
  • Browser: Chrome 69.0.3497.100 Chrome 69.0.3497.100
    • Просмотр профиля
Видео урок: Полноценный Telegram канал на базе A-Parser
Это видео демонстрирует возможность создания полноценного Telegram канала на базе A-Parser. Парсер периодически и без вмешательства пользователя будет собирать контент и публиковать его на канале.

В уроке рассмотрены:
  • Регистрация и настройка канала в Телеграм.
  • Последовательное выполнение нескольких заданий.
  • Сохранение промежуточных данных в базу SQLite с последующим чтением.
  • Настройка пресета для постинга сообщений в Telegram-канал.
Статья с подробным описанием процесса создания: https://a-parser.com/resources/300/
Ссылки на готовые пресеты:
https://a-parser.com/resources/38/
https://a-parser.com/resources/298/
https://a-parser.com/resources/299/
Оставляйте комментарии и подписывайтесь на наш канал на YouTube!

26 Октябрь, 2018, 11:40:09
Ответ #35

Оффлайн A-Parser Support

  • Чайник
  • **
  • Сообщений: 61
  • Репутация: 0
  • OS: Windows NT 10.0 Windows NT 10.0
  • Browser: Chrome 69.0.3497.100 Chrome 69.0.3497.100
    • Просмотр профиля
Сборник рецептов #26: мобильные версии сайтов, список регионов Яндекса и упоминания домена в индексе
26-й сборник рецептов. В нем будут показаны: проверка наличия мобильной версии сайта через Bing, парсинг полного списка регионов Яндекса и способ поиска упоминаний домена в индексе поисковой системы. Также показан пример работы с Node.js модулем mysql2, который позволяет работать с MySQL базами данных. Поехали!

Проверка наличия мобильной версии через Bing
На сегодняшний день наличие мобильной версии является одним из важнейших критериев качества сайта. По данным различных организаций доля мобильного трафика уже давно превышает десктопный. Именно поэтому мобильная версия сайта позволяет увеличить посещаемость сайта, ведь большинство крупных поисковиков отдают предпочтение в выдаче сайтам, имеющим полноценную мобильную версию. Проверить наличие и соответствие стандартам можно с помощью небольшого пресета по ссылке выше.


Получение полного списка регионов Яндекса
Яндекс не публикует в открытом виде полного списка всех регионов, используемых в поиске. И как оказалось, найти полную и актуальную базу в интернете практически невозможно. Поэтому мы исправляем это и по ссылке выше публикуем JavaScript парсер, который позволяет собрать свежую и максимально полную базу регионов Яндекса.


Проверка упоминаний домена в индексе Гугла
Иногда возникает задача по поиску упоминаний домена в индексе поисковой системы. Именно с такой задачей к нам обратился один из пользователей A-Parser. Поэтому по ссылке выше мы публикуем пресет, решающий данную задачу.


Кроме этого:
Еще больше различных рецептов в нашем Каталоге!
Предлагайте ваши идеи для новых парсеров здесь, лучшие будут реализованы и опубликованы.

Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.

06 Ноябрь, 2018, 10:47:13
Ответ #36

Оффлайн A-Parser Support

  • Чайник
  • **
  • Сообщений: 61
  • Репутация: 0
  • OS: Windows NT 10.0 Windows NT 10.0
  • Browser: Chrome 70.0.3538.77 Chrome 70.0.3538.77
    • Просмотр профиля
1.2.335 - новые парсеры картинок, оптимизации в JS парсерах, общие улучшения работы

Улучшения
  • Добавлено 2 новых парсера:
  • Полностью переписаны 2 парсера:
    • SE::Google::Images - добавлены региональные настройки, поддержка рекаптчи, возможность задавать различные фильтры поиска и сбор анкоров, ссылок на страницу, ссылок на превью, а также типов изображений
    • SE::Yandex::Images - добавлен сбор ссылок на превью
  • Улучшена работа SE::AOL, а также увеличено максимальное количество страниц в настройках
  • Улучшена работа SE::Ask, а также добавлена возможность парсить связанные ключевые слова
  • JS парсеры: оптимизирован вызов конструктора и init()
  • JS парсеры: добавлена поддержка async init()
Исправления в связи с изменениями в выдаче
Исправления
  • Исправлена утечка памяти при большом количестве попыток
  • Исправлена ошибка, при которой в Тестовом парсинге при работе с некоторыми ссылками не завершался запрос
  • Исправлен парсинг различных параметров в Net::Whois
  • Исправлено отображение русского языка (проблема появилась в предыдущей версии)
  • Исправлено зависание при работе SE::Yandex::Images с антигейтом
  • JS парсеры: исправлена работа check_content
  • JS парсеры: исправлена работа с сессиями (проблема появилась в одной из предыдущих версий)

16 Ноябрь, 2018, 13:41:04
Ответ #37

Оффлайн A-Parser Support

  • Чайник
  • **
  • Сообщений: 61
  • Репутация: 0
  • OS: Windows NT 10.0 Windows NT 10.0
  • Browser: Chrome 70.0.3538.102 Chrome 70.0.3538.102
    • Просмотр профиля
Видео урок: Массовое добавление товаров в OpenCart, часть 2

Это вторая часть из цикла видео уроков о парсинге товаров из стороннего сайта и заливке их на собственный сайт на базе OpenCart через API.


В этом уроке показано:
  • краткое содержание предыдущей части
  • запуск созданного пресета
  • демонстрация результатов работы
Первая часть: https://a-parser.com/threads/4798/
Статья и готовый пресет опубликованы в нашем Каталоге: https://a-parser.com/resources/302/
Оставляйте комментарии и подписывайтесь на наш канал на YouTube!

23 Ноябрь, 2018, 10:39:39
Ответ #38

Оффлайн A-Parser Support

  • Чайник
  • **
  • Сообщений: 61
  • Репутация: 0
  • OS: Windows NT 10.0 Windows NT 10.0
  • Browser: Chrome 70.0.3538.110 Chrome 70.0.3538.110
    • Просмотр профиля

21 Май, 2019, 11:28:57
Ответ #39

Оффлайн A-Parser Support

  • Чайник
  • **
  • Сообщений: 61
  • Репутация: 0
  • OS: Windows NT 10.0 Windows NT 10.0
  • Browser: Chrome 74.0.3729.157 Chrome 74.0.3729.157
    • Просмотр профиля
1.2.484 - 4 новых парсера, улучшение работы и исправление существующих

Улучшения
  • Новые парсеры:
    • Maps::Google - по ключевым словам собирает различные данные об организациях в заданных координатах
           
    • Maps::Yandex - по ключевым словам собирает различные данные об организациях в заданных координатах
           
    • Rank::Bukvarix:: Domain - сбор ключевых слов по домену
       
    • Rank::Bukvarix::Keyword - сбор ключевых слов по домену
         
  • Удалены 4 неактуальных парсера: Rank::SEMrush::Keyword, SE::QIP, SE::QIP::Position, Rank::MegaIndex
  • Улучшена работа SE::AOL
  • JS парсеры: для this.request добавлена опция data_as_buffer, которая определяет возвращать data как строку(String) или объект Buffer

Исправления в связи с изменениями в выдаче
  • В SE::Google::Modern исправлена работа с рекаптчами, исправлен парсинг сниппетов, а также исправлен парсинг мобильной выдачи
  • Rank::SEMrush полностью переписан, также полностью изменился список собираемых данных, парсер возвращает только те данные, которые доступны без авторизации
  • Полностью переписан Rank::Alexa
  • Исправлена работа Rank::MajesticSEO, теперь обязательно требуется установка Node.js и модуля brotli
  • В Rank::Social::Signal удалена переменная $facebook_share в связи с прекращением поддержки со стороны FB
  • SE::IxQuick, Shop::AliExpressSE:: DuckDuckGo::Images , Shop::Amazon, Check::RosKomNadzor
Исправления
  • Исправлена работа с запросами, содержащими пробел в  SE:: DuckDuckGo
  • Исправлена проблема с декомпресией данных на некоторых сайтах
  • JS парсеры: исправлена работа setImmediate

31 Май, 2019, 11:33:41
Ответ #40

Оффлайн A-Parser Support

  • Чайник
  • **
  • Сообщений: 61
  • Репутация: 0
  • OS: Windows NT 10.0 Windows NT 10.0
  • Browser: Chrome 74.0.3729.169 Chrome 74.0.3729.169
    • Просмотр профиля
Видео урок: Получение уведомлений в Telegram об окончании срока регистрации доменов
В этом видеоуроке будет показано, как настроить периодическую проверку окончания срока регистрации доменов, и получать уведомления в телеграм, если он меньше заданного количества дней.

В уроке рассмотрено:
  • использование tools.js для написания собственных функций
  • работа с шаблонизатором Template Toolkit
  • проверка доменов через WHOIS
  • цепочки заданий
  • отправка сообщений в Telegram с помощью бота
Полезные ссылки:
Оставляйте комментарии и подписывайтесь на наш канал на YouTube!


11 Июнь, 2019, 11:06:26
Ответ #41

Оффлайн A-Parser Support

  • Чайник
  • **
  • Сообщений: 61
  • Репутация: 0
  • OS: Windows NT 10.0 Windows NT 10.0
  • Browser: Chrome 75.0.3770.80 Chrome 75.0.3770.80
    • Просмотр профиля
1.2.503 - обновление JavaScript движка и множество улучшений

Улучшения
  • Движок v8 обновлен до версии 7.5, помимо увеличения скорости есть множество улучшений в поддержке новых возможностей языка JavaScript
  • В SE::Yandex в массив $ads добавлена переменная $visiblelink, в которой содержится видимая ссылка
  • В Rank::Bukvarix:: Domain добавлена переменная $totalcount которая содержит количество результатов
  • В SE::Yahoo добавлена опция Not found is error, указывающая, считать ли отсутствие результатов ошибкой
Исправления в связи с изменениями в выдаче
Исправления
  • Исправлена редкая проблема с ошибками в JS парсерах на Windows
  • В SE::Baidu исправлена работа функции Get full links для результатов без ссылок
  • Исправлена проблема с Decode JSON error в парсерах WordStat
  • Исправлен баг с перезагрузкой кода JS парсера при редактировании в сторонних приложениях, проблема возникла в одной из предыдущих версий

21 Июнь, 2019, 10:42:33
Ответ #42

Оффлайн A-Parser Support

  • Чайник
  • **
  • Сообщений: 61
  • Репутация: 0
  • OS: Windows NT 10.0 Windows NT 10.0
  • Browser: Chrome 75.0.3770.90 Chrome 75.0.3770.90
    • Просмотр профиля
Сборник рецептов #33: парсинг Google карт, сбор вопросов из поиска, перевод текстов целиком
33-й сборник рецептов, в котором мы будем собирать данные из Google maps в указанной местности, спарсим блок вопросов и ответов в поиске Гугла и научимся использовать файлы целиком в качестве запросов. Поехали!

Сбор всех организаций в определенной местности
Начиная с версии 1.2.482 в A-Parser появились парсеры карт Google и Яндекс. Принцип работы обоих одинаков - в настройках указываются координаты точки и зум, парсер собирает результаты поиска по ключевым словам в этой точке и области вокруг нее, ограниченной зумом. Но если стоит задача собрать данные, например, со всего города, то для ее решения нужно указывать диапазон координат и "заставить" парсер пройтись по ним. Как это сделать, а также пример пресета - все это показано по ссылке выше.


Парсер собирающий вопросы и ответы из выдачи Google
Google по некоторым запросам показывает в поисковой выдаче блок вопросов и ответов People also ask (Похожие запросы). Наши пользователи периодически интересуются, как можно парсить этот блок, получая отдельно вопросы и ответы на них. Поэтому мы публикуем в нашем каталоге пример такого парсера, а забрать его можно по ссылке выше.


Использование файлов целиком в качестве запросов
Общеизвестно, что в А-Парсере каждая строка в исходном файле - это отдельный запрос. Но существуют задачи, когда необходимо использовать все содержимое файла как один запрос, игнорируя разбивку на строки. Благодаря JavaScript парсерам такая возможность есть и по ссылке выше опубликован пример парсера, который получает все содержимое файла, переводит его на заданный язык и сохраняет в новый файл.


Еще больше различных рецептов в нашем Каталоге!
Предлагайте ваши идеи для новых парсеров здесь, лучшие будут реализованы и опубликованы.
Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.


02 Июль, 2019, 12:20:59
Ответ #43

Оффлайн A-Parser Support

  • Чайник
  • **
  • Сообщений: 61
  • Репутация: 0
  • OS: Windows NT 10.0 Windows NT 10.0
  • Browser: Chrome 75.0.3770.100 Chrome 75.0.3770.100
    • Просмотр профиля
Видео урок: Макросы подстановок
В этом видеоуроке мы изучим один из инструментов для работы с запросами - макросы подстановок. С их помощью можно значительно увеличивать количество запросов, листать страницы и многое другое.

В уроке рассмотрено:
  • макрос {num} на примерах прохода по страницам и перебора координат в парсере Google maps
  • макрос {az} на примере парсинга по доркам для увеличения кол-ва запросов и соответственно результатов
  • макрос {each} на примере парсинга подсказок для генерации словосочетаний

Полезные ссылки:
Оставляйте комментарии и подписывайтесь на наш канал на YouTube!


12 Июль, 2019, 11:45:02
Ответ #44

Оффлайн A-Parser Support

  • Чайник
  • **
  • Сообщений: 61
  • Репутация: 0
  • OS: Windows NT 10.0 Windows NT 10.0
  • Browser: Chrome 75.0.3770.100 Chrome 75.0.3770.100
    • Просмотр профиля
1.2.534 - 6 новых парсеров, поддержка Node.js в tools.js, множество исправлений в парсерах

Улучшения
  • Добавлено 4 новых парсера Instagram
  • Добавлено 2 новых парсера SerpStat
  • Добавлена поддержка дробных чисел в макросе подстановок {num}
  • Добавлена поддержка Node.js в tools.js, теперь можно использовать возможности Node.js (включая модули) в обычных пресетах во всех полях кроме Parse custom results, фильтров и Конструкторов результатов
  • Шаблоны Template Toolkit в настройках парсеров теперь работают для всех запросов
  • Стабилизирована работа SE::Google::Modern после изменений со стороны Google, благодаря чему несколько уменьшилось количество рекаптч
  • Улучшена проверка ответа в Maps::Yandex, улучшен сбор картинок, а также добавлена возможность собирать ссылки на страницу организации
  • API: для oneRequest/bulkRequest добавлен параметр needData, указывающий, передавать ли в ответе data/pages, используется для экономии памяти, по умолчанию отключен
  • Обновлены apps.json и user-agents.txt, при установке обновления также рекомендуется обновить эти файлы
Исправления в связи с изменениями в выдаче
  • Исправлена ситуация, при которой в SE::Google::Modern выдавался 597 код ответа
  • В SE::Yandex исправлена ситуация, при которой в результатах появлялись "пустые" ссылки, а также исправлен парсинг сниппетов в мобильной выдаче
  • Исправлена редко встречающаяся проблема с SE::Google::Translate, когда парсер получал в ответ 403 статус
  • Исправлено определение языка запроса в SE::Google::Translate
  • Исправлена работа SE::YouTube, а также исправлен сбор $title
  • В Rank::Social::Signal удалена переменная $linkedin_share в связи с прекращением поддержки со стороны LinkedIn
  • В Shop::Yandex::Market исправлен парсинг $features для некоторых видов запросов
  • Исправлен урл запроса в SE:: DuckDuckGo
Исправления
  • Исправлен баг вRank::Bukvarix:: Domain, из-за которого в некоторых случая парсинг завершался с ошибкой
  • В парсерах Maps::* исправлена работа с отрицательными координатами
  • В Rank::SEMrush исправлена ошибка определения "удачности" запроса
  • Исправлен баг в tools.js, возникший после обновления V8
  • API: исправлена работа метода getAccountsCount
  • JS парсеры: исправлен баг со слэшем в check_content