合成はすべてのポイントです。 ハブラハブルライブ


Habrahabr、Yandex、Sportbox、Snob、Kommersantのライブニュースを読む、 iPhoneおよびiPad用の無料モバイルアプリケーションRadio RSSを紹介します。


*何らかの理由で、リソースポストの管理が非公開のブログに移動しました。 おそらく、誰かがHabrが自分を宣伝しているとは思わないように...

Speech Factoryプロジェクトの一環として、 音声 合成技術に基づくサービスの最初のラインを準備しました。

まず、これはiPhoneおよびiPad用のRadio RSSモバイルアプリです。


アプリケーションのデスクトップバージョンは 1年前に発売されましたが、 高得点にもかかわらず、やや冗長であることがわかりました。モニターの前には、目ですぐに実行できるものを聞く準備ができている人はほとんどいません。 すぐにこのニュアンスに気付き、人気のあるサイトのニュースフィードを読み取り、Wi-Fiと3Gネットワ​​ークの両方を介して同等に迅速に動作するスタイリッシュで機能的なモバイルアプリケーションを実装しました。

会う-ラジオRSS。
iTunesのリンク
渋滞にお勧め!




第二に、ボイスカードのエンターテイメントサービス


適切なアプローチを使用すると、このサービスから多くの肯定的な感情を引き出すことができます。 お気に入りの写真を選択し、テキストを作成し、5つの声のうち1つを適切な音楽と組み合わせて、メールまたはソーシャルネットワークへのリンクを送信します。 たとえば、次のようになります

ボイスカード 。 いい気分!


3番目と4番目、合成APIとシンセサイザーの個人アカウント


楽しみから真面目まで。 Speech Technology Centerの合成を使用して独自のサービスを構築したり、テキストを音声化する場合は、合成APIサービスに接続するか(手順はこちら )、アカウントにログインして、任意の大きなテキストを音声化してダウンロードできます。
1週間以内にテストキーを提供します。 実験に来てください。
2週間後、商用目的でサービスを開始します。
1分-1ドル。
連絡先:voicefabric@speechpro.com

五番目に、-字幕音声サービス


しかし、ここでは、ペチキンについての漫画のように-「あなたは文書を持っていないので、私はあなたにそれを与えません」(c)

私たちはサービスを実装しましたが、著作権であらゆる段階で生じる法的困難を克服する方法をまだ知りません。 このサービスを使用すると、驚異的な速度で自動モードで字幕ファイル(.srt)から合成オーディオトラックを自動的に作成できます。 元のビデオと字幕ファイルを送信する入力に対して、出力は元のロシア語の音声を含む完成したビデオです(「Volodarsky効果」を達成するために元のサウンドトラックを完全に消音するわけではありません。元のイントネーションはロボットの単調な声を薄めます)。

このサービスの力をどのように示すかを考えました。 最初にJobsを 、次にLady Gagaを表明しました...それから、TED全体(人気のある国際会議Technology Entertainment Design )を表明することにしました。

そして声を出した

このように聞こえます:



しかし、問題は結果をアップロードする場所です。 彼らは私たちをvimeo.comで(有料アカウントからでも)追い出しました、Yandex.videoはiPadに行きません、 YouTubeでは15分間のビデオ制限があり、一部のビデオは禁止されています(ただし、再び削除されました)...つまり、法的制限はありません希望する形式でこのサービスを展開する機会を与えてください。

しかし、悲しいことに終わらないように、すぐに一連の美しくて便利なモバイルアプリケーションとサービス、そしてもちろんコンテストであなたを喜ばせます。 フィードバックとコメントをお待ちしております。

心から、 VoiceFabric.ruチーム

Source: https://habr.com/ru/post/J129859/


All Articles