コンテンツ固有 英語への翻訳、またはその逆。

個人的に、私はテキストを翻訳する少なくとも2つの方法を知っています。 最初のものから始めます。

これはYahooパイプです。 テキストをロシア語から英語に、またはその逆に翻訳するための最も単純なパイプを削除しました。 そして、すべてがうまくいきますが、2つの問題があります。 最初の-翻訳時に、yuhはすべてのhtmlタグを愚かに削除します。 そして、それらを復元する方法は別の問題です。 些細なことでもないでしょう。 よく、2番目-翻訳モジュールが時々機能しないことがあります。 ヤフーパイプに関するフォーラムで、これに関するサポートの苦情を見つけましたが、すべて修正されたようです。 しかし、1日の異なる時間に10本のパイプのうち約6本が開始しています。

要約すると、yahoo pipesは優れた高速ツールですが、私は使用しません。 たぶんあなたはもっとラッキーかもしれませんが、私にとってはタグの存在とサービスの安定した動作が非常に重要です。

2番目の方法-GoogleのAJAX APIを使用します。 メソッド自体はあまり有用ではなく、何らかの自動化が必要です。 そのため、小さなスクリプトが編成されました。 デバッグのためにset_time_limit(5)を最初から残しました。 これにより、最初はすべてをチェックしてから、1日だけ(まあ、なんでも)実行して、set_time_limit(0)の制限を取り除くことができます。

さらに、スクリプトが機能しない2つの微妙な点があります。 まず、すべての入力および出力文字列がUnicodeであると想定されます。 したがって、編集する場合は、エディターがUTF-8で保存できることを確認してください(私はメモ帳++を使用しています)。 2番目-データベースを操作するには、 dbsimpleライブラリが必要です。 まあ、つまり、私はそれを使用しています。あなたはあなたのニーズにすべての課題をうまく適応させることができます。 すべてがシンプルで透明です。

Google APIには1つの重要な制限があります-翻訳する文字列の長さです。 700文字のように見えますが、600文字の改行を要求するとエラーが発生することがあり、690文字の行が正常に通過することもあります。 現象の規則性は確立できませんでした。 すべてが皮肉にも機能し、文字列の長さは最大545文字であることが実験的に確立されました。 止まった。

スクリプトの主な機能は文字列の変換です(string $ src、string $ langpair)。
string $ srcは、翻訳する文字列です(フルレングス文字列)
string $ langpairは翻訳言語のペアです。 たとえば、「ru%7Cen」。 この行は、URLリクエストを変更せずに置換されるため、この形式です。

さて、ここにあります。 行はそこで1回、2回目-戻って翻訳されます。 スクリプトは小さく、エレガントで、オープンで、そこに何らかの形でコメントされています。 変更や追加は大歓迎です。

スクリプトの長所は、本当に必要なものです。 これが信頼性とタグの保持です。 しかし、ランタイムは貧弱です。 私はホスティングでそれを実行しようとしませんでした-ローカルホスト上の自宅でのみ、非常に厚い専用ではありません。

PS私自身、スクリプトを作成する過程で、1つだけ強調しました。 ユニークなコンテンツを読めないものに変えて-それは難しくありません。 マッシュアップする方がずっといいです。 =)しかし、ツールは残ったので、私は共有します。

これは私のブログから少し変更された記事です。

Source: https://habr.com/ru/post/J30330/


All Articles