私たちは人々のように䜏所を曞きたす

ナヌザヌフレンドリヌなむンタヌフェヌスの利点は、私には党く理解できたせん。

はい、圌は矎しいです、圌ず䞀緒に仕事をするのは簡単です。 しかし、物質的な利益を蚈算する方法は

5幎前、空枯で合成音声が鳎り、各単語の埌に匕き裂かれたむントネヌションで到着ず出発を発衚したした。 堎合によっおは、話し蚀葉の速床でさえ蚀葉ごずに異なっおいたした。

そしお数週間前、私は出発の新しい発衚を聞いた。 圌らは生涯この圹割のために勉匷したプロのアナりンサヌによっお完党に蚘録されたずいう感じがありたした。 むンタヌフェヌスはより良くなり、より自然になりたした。
これからもっず飛び始めたしたか ほずんどない。
空枯間で奜みがありたすか これはそんなに重芁なポむントだずは思いたせん。
しかし、䜕らかの理由で、人々は広告を自然な倖芳にするために時間ずお金を費やしおきたした。 そしお、それはずおもクヌルです

私は、たるで生きおいる人があなたず話しおいるかのように、自動化されたシステムによる情報の自然な提瀺が奜きです。 これらは、補品党䜓に察する態床を圢成する小さなディテヌルであるように思えたす。
そしお、この態床が前向きであれば、あなたは将来遞ばれ、友人に掚薊されるでしょう。

この蚘事では、あたかも人が曞いたように䜏所を1行で衚瀺する方法を説明したす。 蚘事を読むこずで利益が䞊がるずは断蚀できたせん。
しかし、できるだけ倚くのシステムでアドレスを矎しく曞きたいず思っおいたす。

以䞋で説明するすべおのルヌルは、私たち自身が開発したした。 それらのほずんどを䜿甚するか、すぐにdadata.ruに接続したす 。

1幎半前、私たちは人間のやり方で䜏所を曞く方法を考えたした。 Googleは䜏所を簡玠化する方法に぀いお回答を提䟛しなかったため、蚀語孊者ずのコミュニケヌション、テストの実斜、実隓を開始したした。

私たちは、人々がそれを曞く方法で曞かれた、最小限の長さで理解可胜なアドレスを圢成するためのルヌルを開発しようずしたした。

マテリ゚ル


アドレスを自動生成するには、アドレスの゜ヌスが必芁です。 KLADRたたはFIASに぀いお知っおいる堎合は、この項目をスキップしおください。 残りに぀いおは、ロシアでは䜏所が階局的に圢成されおいるこずを䌝えたす。
  1. 各アドレスには件名がありたす。 ロシアには85の科目がありたす。 䟋モスクワ地方、コミ共和囜、モスクワ。
    行政区分によるず、モスクワはモスクワ地方に䜍眮せず、独立した郜垂地域です。
    ヒムキはモスクワではなくモスクワ地方にありたす。 しかし、れレノグラヌドは反察に、モスクワにいたす。
  2. 䞻題には地域ず郜垂がありたす。
    件名に地区のない郜垂は郜垂地区です。 たずえば、ノボシビルスクは「ノボシビルスク地方」ずいう䞻題に盎接埓属しおいたす。
    FIASには、郜垂および町のセンタヌのステヌタスの兆候がありたす。 この情報は、1行で䜏所を䜜成する際に、今埌圹立぀ものになりたす。
  3. 地域には郜垂ず町がありたす。
  4. 郜垂には通りず集萜がありたす。 FIASによるず、そこにはただ远加の領域がありたす。通垞、これらはガレヌゞ建蚭協同組合、庭ず非営利のパヌトナヌシップなどです。
  5. 倚くの堎合、䜏所には郜垂の゚リアを瀺したす。たずえば、「モスクワ、アレクセヌ゚フスキヌ地区」、「ノボシビルスク、」などです。 残念ながら、FIASずKLADRには郜垂内゚リアは存圚しないため、䜏所の自動構築には䜿甚したせん。
  6. 集萜には、通り、远加の領土第4項ず同じ、家屋がありたす。 通りではなく、単に村にある家がありたす。


通垞の語順を䜿甚したす


たず、文字列党䜓を怜蚎したす。 ロシアでは、行政郚門の最高レベルから最䜎レベルたで䜏所を曞くこずに慣れおいたす。 通垞の芁玠の順序は次のずおりです。
  1. 件名;
  2. 地区;
  3. åž‚
  4. 和解;
  5. 通り;
  6. ホヌム;
  7. 家の拡匵建物、建物、階段、床、アパヌト、オフィス、..。

たずえば、「モスクワ地方、ムィティシ地区、ムィティシ垂、りリダノフスカダ通り、ビル3」

さらに、各レベル内の語順は重芁です。 たずえば、「サンクトペテルブルク垂」ではなく「サンクトペテルブルク垂」、「アルタむ準州」ではなく「アルタむ準州」ず曞くのが正しいでしょう。 順序は、タむプごずに独自の方法で決定されたす。

䟋倖を忘れないでください

FIASからのアドレス
ロシア、タタヌルスタン共和囜、カザン垂、カシモフ兄匟通り、64

芁玠を正しい順序に䞊べ替えるず、
ロシア、タタヌルスタン共和囜、カザン垂、カシモフ兄匟通り、64

読みやすくなりたした。 しかし、あなたはより良く、より短くするこずができたす。

フォヌマットを䜿甚しおタむプず名前を分離する


アドレスを読みやすくするのに圹立぀簡単なこずは、倧文字を䜿甚しお名前ずタむプを芖芚的に分離するこずです。

すべおのタむプは小文字で、すべおの名前は倧文字で曞きたす。 ご芧のずおり、2番目のオプションの方が高速です。

宛先
ペトロパブロフスク・カムチャツキヌ垂、カムチャッカ準州、ベヌリングストリヌト、ビル90、アパヌトメント61

埌
ペトロパブロフスク・カムチャツキヌ垂、カムチャッカ準州、ベヌリング街、90、アパヌト61


タむプず名前を枛らす


型の略語はFIASにありたす。 それらを䜿甚し、顧客のコメントに基づいお独自のルヌルを远加し、䞀郚をそのたたにしたす。
略語付きの倚くのタむプ
AALaal
賌読者ボックス私曞箱
ロヌド高速道路
自治区Aobl
自治区JSC
路地路地
アヌバンアヌバン
AULaul
SHOREショア
ヒロックヒロック
ブヌルバヌドブルバヌド。
シャフトシャフト
所有暩WLD
軍事郚軍事郚隊
Volostvolost
入堎入堎
村匷制送還廃止
村OK匷制送還
CITYg
タりンタりン
CITY-BUILDING COOPERATgsk時代遅れ
ガレヌゞず建蚭の協力gsk
ガレヌゞず建蚭協力gsk
ガレヌゞ構築-新しい協力gsk
ガヌデンパヌトナヌシップ同志の庭
地方自治䜓教育蟲村
䜏宅の非営利パヌトナヌシップdnp
架台架台
囜内の村dp
村d
ハりスハりス
ロヌドDOR
鉄道駅過負荷アむテムRailway_op期限切れ
鉄道駅過負荷アむテムRailway_op期限切れ
レヌルストップ。 远い越しITEMRailway_op
鉄道ブヌス鉄道ブヌス
RAIL KAZARMArailway_kazarm
鉄道駅鉄道
鉄道プラットフォヌム鉄道プラットフォヌム
鉄道郵䟿鉄道/郵䟿
鉄道鉄道
動物ポむントWT
䜏宅地リビング゚リア
䜏宅地䜏宅地
到着到着
CAPTURECAPTURE
ゟヌンゟヌン
カザルマ兵舎
チャンネルチャンネル
クォヌタヌsq-l
キロメヌトルkm
RINGリング
郚屋郚屋
コヌドンコルドン
ケヌスto
鎌線組
゚ッゞ゚ッゞ
リゟヌト村kp
レスプロムホズLPH
LINE行
配列配列
䜍眮m
䜍眮地圢
MICRO-DISTRICTmd
ブリッゞブリッゞ
シヌフロントEmb
決枈アむテムnp
AREA地域
地区地区
島島
公園公園
移動移動
レヌンあたり
蚈画゚リアP / R
プラットフォヌムプラットフォヌム
正方圢pl
゚リアpl
ポストノスト墓地
半ば半分
決枈n
郜垂型村
村およびAT駅I駅
VILLAGE TYPE VILLAGEn期限切れ
村n
修理修正
郵䟿局郵䟿局
ルヌトルヌト
工業地垯工業地垯
PROSEC空き地
PROSECAクリアリング
囜田舎道
芋通し通り
流れダクト
流れダクト
LANE路地
働く村rp
接続rzd
地区rn
共和囜担圓者
シリヌズ行
庭庭
庭のいく぀かのパヌトナヌシップsnt
村s
地方行政s / a
蟲村地域s / o
蟲村集萜s / p
地方自治䜓。 教育s / mo廃止
地方自治䜓の画像s / mo時代遅れ
地方自治䜓教育s / mo時代遅れ
地方自治䜓教育s / mo
村議䌚s / s
正方圢正方圢
村SL
DESCENTディセント
ペヌゞst-tsa
駅st
建物ペヌゞ
テリトリヌter
TRACTトラクト
デッドロックダム
STREETst
ULUSで
土地
蟲堎蟲堎
ナヌタヌx
高速道路w
チュバシアチュノァシア
ベラダットベラダット
垂議䌚垂議䌚
郡郡
経枈地域経枈圏
Etrapetrap
ファヌミングf / x
非営利パヌトナヌシップn / a
カスタムパヌトナヌシップDNP
ビヌムビヌム
ベむベむ
灯台灯台
スラむドスラむド
トンネルトンネル
ケヌプケヌプ


型の短瞮圢に぀いお独自のルヌルを䜜成する堎合は、次の2぀の点に泚意しおください。

堎合によっおは、人々は「Big」などの蚀葉を省略したす。 たずえば、「B。 オルディンカ。」 しかし、名前の䞀意性を倱う可胜性があるため、これを自動的に行うのは恐ろしいこずです。

タむプの略語の前のアドレス
ロシア、タタヌルスタン共和囜、カザン垂、カシモフ兄匟通り、64。

埌の䜏所
ロシア、タタヌルスタン共和囜、カザン、カシモフ・ブラザヌズ通り、64。


削陀できるものはすべお削陀したす


理想的なアドレスぞの次のステップは、冗長な情報の削陀です。
䜏所が通信の配信に䜿甚される堎合、小包ず手玙の゜ヌトを簡玠化するために、冗長な情報を残すのが最適です。
䜏所が人が堎所を特定するためだけに必芁な堎合、たたは郜垂の宅配䟿配達が想定される堎合、冗長な情報を削陀するず䜏所がより自然で読みやすくなりたす。

次のルヌルを提䟛したす。
  1. ロシアの堎合は囜を削陀したす。 パリの村のようなたれなケヌスは認識に圱響を䞎えたせん「チェリャビンスク地域、ナガバク地区、パリの村」。
  2. 郜垂のタむプを削陀したす。 郜垂の名前は1぀の地区内で䞀意であるため、この情報は重芁ではありたせん。 「Mr. Voronezh」、「Voronezh」は残りたした。
  3. 郜垂郚から地域を削陀したすこれらは地域で最倧の郜垂です。私はそれらに぀いお䞊蚘で曞きたした。 これらの郜垂はロシアで有名でナニヌクです。 たずえば、「Novosibirsk Region Novosibirsk」ではなく、単に「Novosibirsk」ず曞きたす。
  4. 地区の䞭心付近にある地区を削陀したすFIASずKLADRにサむンがありたす。 圌らはナニヌクで、地域内でかなりよく知られおいたす。 たずえば、「モゞャむスク、モゞャむスク地区、モスクワ地域」ではなく、「モゞャむスク、モスクワ地域」ず曞きたす。
  5. コンテキストから明らかな堎合は、郜垂を削陀したす。 ゚カテリンブルクでのコンサヌトのポスタヌ 各サむトのアドレスに「゚カテリンブルグ」ずいう蚀葉を曞くのをやめたす。

私が蚘事を曞いおいるずきに、「ストリヌト」ずいう蚀葉を削陀するずいうアむデアが浮䞊したした。 このタむプが指定されおいない堎合、デフォルトずしお認識されるように思えたす。 「モスクワ、トノェルスカダ」ずいう実隓を行っおみたしょう。 ストリヌトに぀いおどう思いたしたか しかし、トノェルスカダ広堎がありたす。 ただし、これはただサポヌトされおいない仮定であり、これはご自身の責任ずリスクで行っおください。 このテヌマに関するコメントを聞くのは面癜いでしょう。

明らかな゚ンティティを削陀するず、䟋のアドレスはより読みやすい圢匏になりたす。
それは
ロシア、タタヌルスタン共和囜、カザン、カシモフ・ブラザヌズ通り、64。

次のようになりたした
カザン、カシモフ兄匟、d 64

たたは、コンテキストが蚱可する堎合
カシモフ兄匟、d 64

家の近くのタむプは削陀したせん。通垞、䜏所にはアパヌトや建物の衚瀺も含たれおいるため、䞀郚のタむプの䞍圚は奇劙に思えたす。 しかし、これは奜みの問題です。
カシモフ・ブラザヌズ、64、ビル1、apt。1

たたは
カシモフ兄匟、d 64、建物1、apt。1

䜏所に家が1぀しかない堎合、「家」ずいう単語がなければ、䜏所は良く芋えるだけです。
64カシモフ兄匟


䜏所を2行に分けたす


私たちの䜏所はすでに良くお矎しいので、むンタヌフェヌスに衚瀺できたす。
曞匏蚭定の助けを借りおそれをさらに簡玠化する方法が1぀ありたす。2行に分割したす。1行目は郜垂、地区、䞻題をこの順序で蚘述し、2行目は集萜、通り、その他すべおを蚘述したす。

FIASからの元のアドレス
ロシア、タタヌルスタン共和囜、カザン垂、カシモフ兄匟通り、64。

このように曞きたしょう
カザン、
64カシモフ兄匟


それだけです 情報が圹に立぀こずを望み、自然蚀語でプログラムを「話す」方法を教えおください。
䜏所に぀いお質問がある堎合は、お問い合わせください。 私たちはこのトピックを愛し、垞に助けようずしたす。

Source: https://habr.com/ru/post/J254757/


All Articles