Копирование определенных данных с веб-сайта в Excel

Мой друг попросил меня найти способ получить информацию с веб-сайта и поместить ее в файл Excel.

Это веб-сайт, о котором идет речь: http://www.manta.com/world/North+America/Canada/Newfoundland/grocery_stores--B619B/#Location

Он хочет иметь файл Excel со списком всех имен, адресов и номеров телефонов всех результатов его поиска.

Пока я в тупике с идеей. Я довольно новичок в интернет-программировании.

Я подумал, что, возможно, я мог бы создать пользовательский скрипт Greasemonkey, который будет искать все необходимые данные на странице и одним нажатием кнопки открывать всплывающее окно, в котором будут данные в формате CSV, которые затем можно скопировать и вставить в превосходить Однако телефонных номеров нет на странице результатов поиска, поэтому я не думаю, что это возможно.

Моей второй мыслью было создать веб-страницу, которая будет искать этот сайт и получать все необходимые данные, а затем предоставлять опцию «Загрузить данные в Excel». Возможны ли эти идеи и как мне лучше всего их реализовать? Есть ли способ лучше? Спасибо!


person Peter    schedule 14.08.2011    source источник
comment
это нарушает TOS сайтов, вы не должны этого делать,   -  person    schedule 15.08.2011
comment
@ Дагон, да, я этого не понимал!   -  person Peter    schedule 15.08.2011
comment
@Dagon Я не отрицаю, что это так сказано, но просто интересно, где сказано, что ты не можешь этого сделать?   -  person Peter    schedule 15.08.2011
comment
manta.com/coms2/page_terms_conditions_view Лицензия и разрешенное использование, вы всегда можете уточнить у них . большинство людей не будут беспокоиться, но как создатель интеллектуальной собственности я всегда это делаю.   -  person    schedule 15.08.2011


Ответы (1)


На этот вопрос было бы легче ответить, если бы мы знали, с какими языками вы знакомы.

Предполагая, что в Windows это можно сделать с помощью jscript или vbscript на WSH с помощью WinHttpRequest , доступ к excel можно получить через ActiveX. Если вам нужен пользовательский интерфейс, я бы предложил HTA.

person Dr.Molle    schedule 14.08.2011
comment
Таким образом, вы можете использовать подход, описанный в моем ответе. Также можно использовать PHP, вы можете прочитать страницу с помощью file_get_contents() или аналогичного, доступ к Excel можно получить в PHP через COM (конечно, вы также можете использовать некоторую библиотеку, например pear.php.net/package/Spreadsheet_Excel_Writer/redirected ) - person Dr.Molle; 15.08.2011