Я получаю твиты из определенного региона, но получаю очень разные наборы результатов. Первый метод, задавая долготу и широту в пределах заданного радиуса. Это долгота и широта в пределах города (Лахор, ПК) и радиус рисования 5 км. 5 км - очень маленькая часть этого города. К этому времени я получил около 60 000 твитов за один день.
Метод1
import tweepy
consumer_key= 'xxxxxxxxxxxxxx'
consumer_secret= 'xxxxxxxxxxxxx'
access_token='xxxxxxxxxxxxxxx'
access_token_secret='xxxxxxxxxxxxxxxxxxxx'
api = tweepy.API(auth,wait_on_rate_limit = Truewait_on_rate_limit_notify= True)
public_tweets = tweepy.Cursor(api.search, count=100, geocode="31.578871,74.305184,5km",since="2018-06-09",show_user = True,tweet_mode="extended").items()
for tweet in public_tweets:
print(tweet.full_text)
Второй метод, я использовал API гео-поиска в Твиттере, запросив Лахор, гранулярность = город. Теперь я получаю твиты всего города. но теперь я получаю 1200 твитов только за один день. Я также получил за последние 7 дней и получил только 15 000 твитов. Это очень большая разница в том, что весь город дает мне только 1200 твитов, а небольшая часть того же города дает мне более 60 000 твитов. Я также печатаю идентификатор места, чтобы убедиться, что получаю точные полигоны. Это многоугольники (74.4493870, 31.4512220 74.4493870, 31.6124170 74.2675860, 31.6124170 74.2675860, 31.4512220), и я рисую их на https://www.keene.edu/ для проверки. и да, это точные полигоны города Лахор.
Метод 2
import tweepy
consumer_key= 'xxxxxxxxxxxxxx'
consumer_secret= 'xxxxxxxxxxxxx'
access_token='xxxxxxxxxxxxxxx'
access_token_secret='xxxxxxxxxxxxxxxxxxxx'
api = tweepy.API(auth,wait_on_rate_limit = Truewait_on_rate_limit_notify= True)
places = api.geo_search(query="Lahore", granularity="city")
for place in places:
print("placeid:%s" % place)
public_tweets = tweepy.Cursor(api.search, count=100,q="place:%s" % place.id,since="2018-06-09",show_user = True,tweet_mode="extended").items()
for tweet in public_tweets:
print(tweet.full_text)
А теперь сначала скажите мне, почему существует огромная разница в результатах. Я использую стандартную версию Api.
Во-вторых, расскажите мне, как эти (api) получают твиты. потому что менее 1% твитов имеют геотеги, а также не каждый пользователь в этом профиле указывает точный город и страну. Некоторые пользователи упоминают Марс и Землю и т. Д. Итак, как эти API работают для получения твитов в определенном регионе. либо поиск по радиусу, либо запрос города / страны. Я изучал твиттер-API и твип-документацию, чтобы изучить, как эти API-интерфейсы работают в фоновом режиме для сбора твитов из определенного региона, но я не нашел никаких полезных материалов.