Yandexは、毎日数千万のクエリに回答する必要があります。 検索エンジンは、それらを迅速かつ正確に処理できる必要があります。 言語学がなければ、検索エンジンはインデックス付きドキュメントで完全に一致するもののみを見つけることができます。 関連するドキュメントを見つけるには、システムがリクエストの言語を正しく決定し、タイプミスを修正し、各単語の形態学的分析を行い、同義語でクエリを拡張するか、さらには再定式化する必要があります。 このレクチャーでは、Alexey Zobninは
Small ShADの生徒に次の質問に対する答えを与えようとしました。
- なぜ形態を考慮する必要があるのですか?
- リクエストとドキュメントの言語をどのように、またなぜ決定するのですか?
- 言語エンクロージャとは何ですか?
- 言語モデルとは何ですか?また、検索でどのように適用されますか?
- 非語彙の形態学的分析はどのように行われますか?
- 同音異義語の正しい意味と形態学的パラダイムを決定する方法
- タイプミスとは何ですか、またどのように修正しますか?
- クエリ拡張機能とは何ですか?
講演ページ当初、講義は高校生向けに設計されていますが、大人はそれから多くを学ぶことができます。
プレゼンテーションは
こちらからダウンロードでき
ます 。
Small ShADの講義は、コンピューターサイエンス、数学、言語学、および関連する知識分野に専念しています。
スピーカー-一流の科学者、ハイテク企業の専門家、有名な大学の教師。 各講義の後、聴衆とディスカッションが行われ、質問に答えます。
私たちは聴衆の中で学校や会議を訪れるという非公式の雰囲気を保つよう努めています。 講義は互いに完全に独立しており、学生は興味深いトピックを自由に選択できます。 クラスは無料です。