Для лучшего понимания контекста см. этот пост
Вдохновившись парой поддержавших меня анонов и многоуважаемым avpretty, я сделал для его парсера графическую оболочку - https://github.com/mnocard/reactor-crwUI.
Она написана на WPF, поэтому работает только на windows. Скачать можно здесь: https://github.com/mnocard/reactor-crwUI/releases
Для работы оболочки нужен парсер, который вы можете скачать здесь https://github.com/reactor-joy/reactor-crw/releases
Оболочка выполняет единственную функцию - печатает за вас аргументы и передает в запускаемую командную строку. Всё остальное делает сам парсер. Для минимальной работы нужно указать только путь к парсеру и адрес страницы.
Остальные настройки соответствуют аргументам парсера. Единственное, что я позволил себе - переименовать workers в приоритет загрузки и установить максимальное ограничение в 4 единицы.
Знаю, что внешний вид довольно вырвиглазный, если кого-нибудь будет слишком сильно тошнить, могу включить стандартный вид windows приложений. Если будут предложения по изменению внешнего вида, с радостью выслушаю.FAQ:
q: Зочем?
a: Просили.
q: В чем различия версий cut и full?
a: Full-версия содержит необходимые для запуска приложения элементы .net (по этой же причине такая большая разница в размерах файлов). Есть высокая вероятность, что они уже установлены у вас, поэтому попробуйте сначала cut-версию. Если не взлетит, пробуйте full. Если и full не взлетит, то пишите, что бы я встроил логгер, потом будем разбираться
q: У меня есть предложение.
a: Не держи всё в себе, поделись со мной любым удобным для тебя способом. Лучше публичным.
q: Не парсит!
a: Парсинг зависит только от парсера, представленная программа - лишь оболочка для него. Всего лишь пакетик, в который вы заворачиваете свой хлебушек.
q: Скачай одно, скачай другое... Почему нельзя всё в одном?
a: Есть определенные сложности с тем, чтобы связать приложение на C# и Golang. Как только и если мы с avpretty их преодолеем, так сразу сделаем (наверное) приложение 2 в 1.
PS: У приложения нет иконки. Было бы круто, если бы кто-нибудь нарисовал иконку 50*50 пикселей в стиле реактора.
Подробнее
ш reactor_crwUI □ X Путь к r-crw Папка загрузки Адрес страницы Запуск Строка Cookies Q Тип контента: Q Изображение Q gif D webm Q mp4 Загружать только одну страницу Q Приоритет загрузки: 1
reactor-crw,парсер,gui
оооо, споры в интернете вышли на новый уровень
Чтобы все ахуели, как мы можем?
Оболочка нужна в первую очередь тем, кто не хочет запускать cmd под виндой, плюс народ попросил.
Надеюсь никто не ахуел.
Так же по части скорости можно попробовать поэксперементировать с расширенными настройками запросов. Там по умолчанию все в минимуме, т.к. можно и в бан отлететь если спамить воркерами \ малыми интервалами, так что нужно осторожно все менять и это скорее для тех кому реально что то такое нужно.
что такого было в той тулзе, чего нельзя перенести на шарп в кратчайшие сроки?
шарп быстрее голанга
>тяжелее
если собирать не self-contained бинарник, шарповый бинарь легче. Хотя кому какая разница сколько весит бинарь - 4мб или 26...
>в кратчайшие сроки парсер не написать в принципе...
с тем же HAP написать парсер вообще не проблема. Есть даже порт puppeteer для самых хитровыебаных сайтов (к которым реактор не относится)
А где брать "Строку Cookies"?