今日、
Google Developers Dayイベントの一環として、私は
Vladimir Ofitserovと話をすることができました
。VladimirOfitserovは 、このイベントのためにモスクワに飛びました。 ウラジミールはGoogle検索品質部門のスペシャリストであり、サイトのユーザーにとって興味深いテーマに関する質問をいくつか尋ねました。

1999年以来、Vladimir Ofitserovは、Yahoo検索エンジンの基礎となった最初のインターネット検索エンジンの1つである
Inktomiで働いていたことを思い出させてください。 ヤフーでは、ウラジミールが参加し、ランキングアルゴリズムの改善、インフラストラクチャのスキャン、インデックス作成を目的としたプロジェクトを主導しました。 2008年、ウラジミールはYahooのエンジニアグループと共にカリフォルニアに拠点を置くYandex Labsに移り、ロシアのインターネットでの検索の改善を目的としたプロジェクトに取り組みました。 2010年以来、彼女はGoogle検索品質部門で働いています。
-ヤフー、ヤンデックス、グーグル...ウラジミール、あなたの仕事のそのような一連の場所を見て、ある人は思わず質問をします-これはどうして可能ですか? 最初の会社のすべての秘密(NDA)を最初の会社から2番目の会社に移すのは本当に簡単ですか? ある場所から別の場所に移動する理由を教えてください。-1999年、Inktomiの同僚の1人は、1997年にYandexを組織した
Arkady Volozhの友人である
Arkady Borkovskyでした 。 長い間、私はInktomiで、後にYahooでArkadyと仕事をし、Yandexがオフィスを開設することを決めたとき、このオフィスの長の選択は自然にArkady Borkovskyに委ねられました。 長い間彼らと仕事をしていたので、私はちょうどこのオフィスを設立した人の一人になりました。 そして秘密について-カリフォルニア州では法律の観点から、これに問題はありません。
-つまり、実際、ある会社からの誘惑はなかったのですか?-まさに。 ヤフーは、ご存知のように、検索の実行を停止し、完全にBingに切り替えました。 この傾向はしばらく前に顕著でした-同社は人々にも、テクノロジーにも、コンピューターにも投資しませんでした...そして実際、Yahooの存続期間は非常に長くなりました。 Yandexは(管理、意思決定などの点で)非常に優れた企業ですが、数百万人の40人が使用している企業から5億人以上が検索する企業に移行できる場合、その選択は明らかです。 特に、検索を本当に改善する動機がある場合。
-今年の1月からGoogleと連携しています。 以前の仕事と比較して、根本的な違いはありますか? 新しい場所に以前の職場にあったものが欠けているようなものはありますか?-Googleにアクセスして最初に目にするのは、それがグローバル企業であることです。 人々は、オフィス、部門間で、互いに非常に簡単に通信します...そして通信は非常に動的です。 それでもYandexはロシアで育ち、これは感じられます-それはより閉鎖的です...彼はグローバルビジネスを組織するための経験とアプローチが少ないです。
-では、問題の技術的な側面について少し話しましょう。 Googleがライブ検索に切り替えることにしたのはなぜですか? また、最近検索結果にサイトのプレビューが表示されました。-そもそも、ユーザーの約30%はライブ検索をまったく表示していません-原則として、ブラウザーのアドレスバーに要求を入力するユーザー。 残りの平均的なユーザーの場合、「ライブ検索」により約2〜3秒節約されます。 しかし、2本の指でゆっくりとテキストを入力する人のことを忘れてはなりません。彼らにとって、「ライブ検索」は30秒以上も節約できます。 ほんの数文字をクリックするだけで、必要なクエリを選択できる可能性が高くなり、印刷する必要がなくなります。 多くの場合、これは非常に大きなプラスになる可能性があり、他の人はいつでもこの機能をオフにできると判断しました。
-ほとんどの場合、ユーザーは一般的な意味で自分が探しているものを想像しているようです-したがって、彼は単にすべての副作用を必要としません。 しかし、たとえば、これらの「目に見えない結果」で、Google AdWordsを使用して広告主にお金をかけるようなものはありますか?-広告に関しては、これに問題はありません-お金が費やされるのは、人がリクエストを完了したときだけであり、この瞬間を決定するメカニズムがあります。 逆に、ライブ広告検索の場合、表示されるものは少なくなります。
-リクエストをこのように予測すると、検索を行う人が間接的に操作される可能性がありますか? 何かを探しているだけで、「探したいもの」(「誰もがこれを探している!」または「誰でもこれを答えと考えてください!」)。-検索エンジンが何らかのクエリを完了するために提供する重要な要素は、その結果が「良い」ことを知っていることです。 提案されたオプションの中のユーザーが自分が見つけたいものと似ている場合は、検索エンジンの観点から、これはクエリ、目標を定式化する理想的なオプションです。 つまり、ユーザーがリクエストの文言に苦労しているが、マシンが提供するリストに、探しているものに似たものが表示されている場合、おそらくはるかに速く検索されます。
-ソーシャル検索について何が言えますか? Googleは、アルゴリズムに基づく一般的な検索方法とは異なり、インタラクションとユーザー支援に基づいて検索結果の関連性を判断する検索を作成する予定はありますか?-このような検索は、近い将来、来年、さらには今年にも現れると思います。 さらに、Googleプロフィールでtwitter-、facebook-account(およびその他のソーシャルネットワーク)を指定できるようになりました。その後、Googleは友達のチェーンを構築します。 そして、それらの1つが彼のブログまたはソーシャルネットワークに何らかのリンクを公開し、このリンクの情報コンテンツが検索クエリに類似している場合、対応するマークが付いた一種の「友好的な」結果が得られます。
-現在の検索の問題の1つは、彼が「詳細」ではなく「詳細」に見ていることです。 つまり、たとえば、結果の「ペン」の要求では、書き込みからドアまで、膨大な数の多種多様なハンドルがあります。 しかし同時に、「 ペンのリクエストで、 190万件の結果が見つかりました」-「ペンとは何ですか?」と尋ねるのと同じです。そして、「この質問に対する1,900,000件以上の答えを知っています。どっち? つまり、情報の不均一性を背景にすべての即時の利益が失われます。 これに対処する方法はありますか?-現時点では、特にそのような同音異義語に関しては、マシンは実際にあなたが探しているものを正確にそのようなレベルで予測することはできません。 ただし、このような状況では、いくつかの値に関する情報を表示しようとします。 さて、私たちが見ているように、技術は静止していません-不可能はないと思います。
-現代の検索には他にどのような問題がありますか? 現時点であなたに合わないものは何ですか?また、できるだけ早く修正したいものは何ですか?-多くの問題がありますが、最も深刻な問題の1つは検索結果のスパムです。 少なくともロシア市場では、これが重要な要因の1つであり、この情報をフィルター処理しようとします。
数年前から見られているもう1つの傾向は、多数のキーを押す必要のない情報の提供です。 たとえば、この問題を解決する手順の1つは、最近導入された音声検索でした。
-たとえば、5年後の検索結果はどうですか。 10年で? 今、彼らは拡張現実について多くのことを話します...?「
私が知っていれば... 」ウラジミールは言って笑った。 このとき、ささやき声で、同僚の側からヒントが聞かれました
。 」
おそらく、検索はユーザーにより近くなるでしょう。 パーソナライズ、ローカライズ、地域化、社会化-これらの側面はすべて、現在の検索エンジンを大きく変えると思います。 このデータには多くの情報があるという理由で-あなたの友人以上に誰もあなたのために言うことはありません。
-したがって、最近のFacebookとの対立は、一見すると思われるよりもはるかに重要ですか?-私たちは常に競合他社を真剣に考えており、同じことをしていると思います。 しかし、検索ネットワークとソーシャルネットワークの間には多くの共通点があり、これらのおかげでこれらのサービスの作業をさらに改善することができます。 Facebookがインターネット全体に配置した「いいね」をもっと知っていれば、発行の質ははるかに高くなる可能性があります。
-それは、今、実際、検索の進行を遅くしているのはまさにFacebookとのこの競争ですか?-まさに。 遅かれ早かれ、これらの障壁がずっと低くなることを願っています。
-ウラジミール、10年以上の「検索」の仕事、あなたはたぶん多くの興味深い物語や珍しい物語を蓄積したでしょうか? 最も記憶に残る、いわば、笑うべき物語と泣くべき熊手の物語を教えてください。-1年前、2002年に、ランタイムシステム(0.5秒のリクエストに応答するシステム)で作業していた面白いケースがありました。ログで検索クエリを見つけ、1分以上処理されたので、それを把握することにしました。 ユーザーは、各文字の後にスペースを入れて検索行に「私はバレンタインの日に一人でいます」と入力したことが判明しました(「I amalone I nvalent I ne 'sday」)。 その結果、検索エンジンにはほぼすべてのアルファベットが表示され、各文字には数百および数千のドキュメントが含まれていました。システムはそれらを組み合わせて最適な結果を出すのに苦労しました。 [
注:Yandexで同様のクエリを入力しようとしました-ほんの1分ではありませんが、実際にはバタートです。 グーグルでOK ]
ここでいくつかの楽しい検索質問のリストを作成しました...時々読むのが楽しいです。
-電車のトイレのチタンスクラップについて? :)-いいえ、これはすでに古典的です:)ここに新鮮なものがあります。 これを探すときにどのユーザーがガイドされるかは不明です。 たとえば、「
どのフリンジが私に合っていますか? 「。

熊手については...それもすべてでいっぱいでした。 しかし、プログラマーの観点からすると、最も恐ろしいレーキは、所有していないメモリを解放することです。 それは良いことにはならないでしょう。
-うん、面白い。 そして、例えば、あなたの足跡をたどりたい人に何をアドバイスできますか? たぶん、あなたは最も面白い本のいくつかをアドバイスするでしょう...それは、ダミーのためのGoogleだけでなく、もっと真剣で、本当に価値がある何かです。 それとも、印刷された形式に興味深いものはありませんか?ネットワークの広大な広がりの中で最も美味しいものをすべて探す価値はありますか?-私の足跡を歩くことは全く必要ありません-誰もが自分の道を選ぶべきです、本当に面白いです。 情報に関する限り、2つの興味深い本をお勧め
します。情報検索の紹介 [Christopher D. Manning、Prabhakar]は、スタンフォードの教授が書いたより学術的な本です。 つまり、基本的なことです。 そして、
検索エンジン:実際の情報検索 [Bruce Croft、Donald Metzler、Trevor Stohman]は、既にGoogleのエンジニアによって書かれた実践的な本です。 たとえば、独自の検索エンジンを作成したい人に適しています。多くのメカニズムの動作、効果的なコードの作成、その他多くの有用なことについて語っています。 そして、もちろん、インターネット-必要に応じて、いつでも興味深い、そして最も重要な関連情報を見つけることができます。
よろしくお願いします! さて、最後に、おそらく秘密を共有しますか? 私たちのサイトの読者専用の簡単なものはありますか?-まあ、彼らは秘密であり、秘密です:)それにもかかわらず、たとえば、最近公開された、非常に大きなボリューム(インデックス以上)を処理するように設計されたプログラミング言語など、何かが定期的に明らかにされています。 それはあるロシア人によって書かれたもので(科学者に言葉を言うのを恐れない)、長い間私たちの「ノウハウ」でしたが、約1週間前にこの情報が公開されました。 必要に応じてグーグルで検索できます。 まあ、または十分に豊富なJava Webアプリケーションを開発するための同じクロージャーとGWT(その後、JavaScriptでコンパイルされ、ブラウザでのコンパイル、ロード、およびランタイムに最適になるようにパッケージ化されます)-このすべてのGoogleは開発者に提供されています。
LiveJournalの作成者であるBrad Fitzpatrickがいます。実際、彼は「通常の」プログラマであり、LJに加えて、Googleにいくつかの事柄(主にメソッドとクラス)を書いています。すべておよび類似の例は非常に多く与えられます。 もっと簡単に言えば、Googleは「永久に」プロジェクトを作成することで、エンジニアリングから宗教を作る会社です。 ほとんどの場合、これらは(競合他社のメカニズムよりも)はるかに複雑なメカニズムであり、そのすべての微妙な点を取り上げて開くことはできません。

この会議が終わり、記念品として写真を撮り、イベント自体に行きました。Habréに登録された多くの人々に嬉しく思いました。
頑張って!