SQL構文に関するTwitter APIのリクエスト

TweeQLクエリ言語はSQL構文に基づいてモデル化されており、ツイートデータベースをリレーショナルデータベースと同じくらい簡単に操作できます。

TweeQLの構文は次のとおりです。

SELECT field1, field2 FROM streams WHERE filter_conditions GROUP BY field3, field4 WINDOW x seconds 

たとえば、次のようなクエリ

 SELECT text FROM twitter_sample WHERE text contains 'bobuk'; 

ツイートのストリームから、「bobuk」に言及するフラグメントを取得します(bobukは、Runet上のTwitter APIの最もアクティブなユーザーとしての例のためだけにここにあります)。

これはすべて、正しいAPIリクエストのすべての詳細を考慮する必要はありません。

TWITTER_SAMPLEは、総数の約1%を含むツイートのストリームです。 一般ストリームにリクエストを行う必要がある場合は、データソースとしてTWITTERを指定します。

フィルターされたツイートは、ローカルディスク上のデータベースに保存できます(そのパラメーターはsettings.pyで設定されます)。 パフォーマンス上の理由から、データベースへの書き込みは1000レコードに達した場合にのみ可能であるため、フィルター処理されたレコードが少ない場合、それらは保存されません。

TweeQLはPythonでエンコードされています。

Source: https://habr.com/ru/post/J107186/


All Articles