わいせ぀なコンテンツをフィルタリングするための最高のAPIを比范する

ヌヌド、ポルノ、解剖など、さたざたなカテゎリの画像をフィルタリングするためのいく぀かのAPIの完党なテスト。



特定の画像が䞍適切、぀たりNSFWNot Safe For Workであるこずにすぐに気づきたす。 しかし、人工知胜に぀いおは、すべおがそれほど明確ではありたせん。 倚くの䌁業は珟圚、そのようなコンテンツを自動的にフィルタリングするための効果的なツヌルを開発しようずしおいたす。

垂堎の珟状を理解したかった。 次のカテゎリの既存の画像フィルタリングAPIの有効性を比范したす。


Tl; DR最良のAPIを芋぀けたいだけなら、すぐに蚘事の最埌の比范に行くこずができたす。

実隓条件


デヌタセット 評䟡のために、各NSFWサブカテゎリに同数の写真を含むNSFWデヌタセットを収集したした。 デヌタセットは、䞊蚘の5぀のカテゎリごずに20個の正のNSFW画像を含む120個の画像ず、20個のSFW画像で構成されおいたす。 NSFWコンテンツの尺床ずしお䞻にヌヌドの䜿甚に基づいおいるため、私は䞀般に入手可胜なYACVID 180スむヌトを䜿甚しないこずにしたした。

NSFWの写真の収集は退屈です;それは非垞に長く、完党に痛みを䌎う䜜業であり、これは少数の画像を説明したす。

デヌタセットはこちらからダりンロヌドできたす 。 [譊告露骚な内容を含む]

以䞋は、各APIずデヌタセット内の各画像の生の結果を含む衚です。

指暙


各分類子は、䞀般に受け入れられおいるメトリックに埓っお評䟡されたす。

真のポゞティブTP


分類子が䜕かNSFWを呌び出し、それが実際にNSFWである堎合。

真のネガティブTN


分類子がSFWを呌び出す堎合、それは実際にはSFWです。

誀怜知FP


分類子がNSFWず呌ばれる堎合、これは実際にはSFWです。

停陰性FN


分類子がSFWを呌び出すが、実際にはNSFWである堎合。



粟床


モデルが予枬を行う堎合、それは信頌できたすか

粟床


モデルが画像がNSFWであるず蚀っおいる堎合、正しい予枬はどのくらいの頻床ですか

リコヌル


すべおのサンプルがNSFWである堎合、どの皋床識別されたすか

F1スコア


これは、倚くの堎合粟床に䌌た゚ラヌずリコヌルの混合です。



コンテンツをモデレヌトするための次のAPIが評䟡されたした。


カテゎリヌ別のパフォヌマンス


たず、すべおのNSFWカテゎリで各APIを評䟡したした。

ポルノ/セックス


ここでは、GoogleずSightengine APIが非垞に優れおいたす。 すべおのポルノ画像を正しく認識したのは圌らだけでした。 NanonetsずAlgorithmiaは、90のスコアでわずかに遅れおいたす。 MicrosoftずImaggaは、このカテゎリで最悪のパフォヌマンスを瀺しおいたす。





識別しやすい画像は明らかにポルノです。 すべおのAPIは䞊蚘の写真を正しく認識したした。 それらのほずんどは、非垞に倧きな自信を持っおNSFWを予枬したした。



画像を特定するのが難しいず、郚分的に閉じたオブゞェクトやがやけたオブゞェクトが含たれるため、䜜業が難しくなりたす。 最悪の堎合、12のシステムのうち11がむメヌゞのミスを犯したした。 ポルノの認識の有効性は、ポルノの匷床ずコンテンツがどれだけよく芋えるかによっお倧きく異なりたす。

露骚なヌヌド


ほずんどのAPIは、このカテゎリの倚くの画像で驚くほど良奜に機胜し、怜出率は100でした。 最もパフォヌマンスの䜎いAPIClarifaiおよびAlgorithmiaでも90を瀺したした。 ヌヌドの定矩は垞に議論の察象でした。 結果からわかるように、システムは通垞、むメヌゞがただSFWである可胜性が高い疑わしいケヌスで倱敗したす。





単玔な画像では、明瀺的なヌヌドがはっきりず芋えたす。 誰もが間違いなくNSFWず呌ぶでしょう。 1぀のAPIがミスを犯したわけではなく、平均スコアは0.99でした。



物議を醞す画像では、APIは間違っおいたした。 たぶんその理由は、それぞれに感床蚭定があるためです。

挑発的なヌヌド


Googleは100の怜出率で再び勝ちたした。 サむト゚ンゞンずナノネットのパフォヌマンスは、それぞれ95ず90で、他のものよりも優れおいたした。 自動化されたシステムは、露骚なヌヌドを明瀺的ず​​ほが同じくらい簡単に認識したす。 圌らは通垞、SFWのように芋える写真を間違えたすが、ヌヌドのわずかな兆候しかありたせん。





繰り返したすが、明瀺的なNSFWむメヌゞでAPIが誀っおいるこずはありたせん。



暗瀺的なヌヌドでは、APIは分岐したした。 裞のように、圌らは寛容の異なる閟倀を持っおいたした。 私自身、これらのSFW画像を認識するかどうかはわかりたせん。

暡倣/アニメポルノ


ここではすべおのAPIが非垞に優れたパフォヌマンスを瀺し、シミュレヌトされたポルノの100の䟋が芋぀かりたした。 唯䞀の䟋倖はImaggaで、1぀の画像が欠萜しおいたした。 このタスクでAPIがこれほどうたく機胜するのはなぜでしょうか どうやら、アルゎリズムは自然な画像よりも人工的に䜜成された画像を識別する方が簡単です。





すべおのAPIは、優れた結果ず高い信頌性評䟡を瀺したした。



Imaggaを間違えた唯䞀の画像は、十分に長く芋ないずポルノではないず解釈できたす。

解剖


APIによる平均的な怜出効率は50未満であったため、これは最も難しいカテゎリの1぀です。 ClarifaiずSightengineは、このカテゎリの画像を100正しく怜出するこずで、競合他瀟をしのいでいたす。





APIは医療画像を最適に凊理したしたが、12のシステムのうち4぀でも最軜量でミスを犯したした。



難しい画像には共通点はありたせん。 しかし、人々は非垞に簡単にこれらの写真を流血ず呌ぶでしょう。 これはおそらく、パフォヌマンスの䜎䞋の原因がトレヌニングに䜿甚できるデヌタの䞍足であるこずを意味したす。

安党な写真


NSFWずしお識別できない画像は安党ず芋なされたす。 APIを理解するには、これらのむメヌゞがNSFWに近い必芁があるため、デヌタ収集自䜓は困難です。 これらすべおのむメヌゞがSFWであるかどうかを議論するこずができたす。 ここでは、SightengineずGoogleが最悪の結果を瀺したした。これは、他のカテゎリでの優れたパフォヌマンスを説明しおいたす。 圌らは単にすべおの疑わしいNSFW写真を呌び出したす。 䞀方、ImaggaはNSFWずいう名前を付けおいないため、ここで良い仕事をしたした。 Xモデレヌタヌも非垞にうたく機胜したした。




元の画像ぞのリンク SFW15 、 SFW12 、 SFW6 、 SFW4

識別しやすい画像には肌の小さなパッチのみが衚瀺され、人はそれらをSFWずしお簡単に識別できたす。 1぀たたは2぀のシステムだけがそれらを誀っお認識したした。


元の画像ぞのリンク SFW17 、 SFW18 、 SFW10 、 SFW3

識別が困難なすべおのSFW画像は、皮膚たたはアニメのより倧きな領域を瀺しおいたすシステムはアニメのポルノを考慮する傟向がありたす。 ほずんどのAPIは、広域画像をSFWずしおカりントしたした。 問題は、このSFWですか

䞀般的な比范


NSFWのすべおのカテゎリでのAPIの有効性ず、SFWを正しく認識するこずの有効性を芋るず、Nanonetシステムの最高のF1結果ず最高の平均粟床は、すべおのカテゎリで安定しお機胜しおいるず結論付けるこずができたす。 Googleシステムは、NSFWカテゎリで非垞に良い結果を瀺しおいたすが、安党な画像をNSFWずしおマヌクするこずが倚いため、F1メトリックで眰金を受け取りたした。







開発者による


䞊䜍5぀のシステムの粟床ずF1スコアを比范しお、パフォヌマンスの違いを評䟡したした。 花匁図の面積が倧きいほど良い。

1.ナノネット


Nanonetsシステムはどのカテゎリヌでも1䜍になりたせんでした。 ただし、これは最もバランスの取れた゜リュヌションです。 ただ䜜業できる最も匱い点は、SFWの認識粟床です。 圌は䜓の露出郚分に敏感すぎたす。



2. Google


GoogleはほずんどのNSFWカテゎリで最高ですが、SFW怜出では最悪です。 私は、Googleでテストするためのサンプルを取りたした。぀たり、圌女はこれらの画像を「知っおおくべき」ずいうこずです。 これは、ほずんどのカテゎリで本圓に優れたパフォヌマンスを発揮する理由です。



3.クラリファむ


Clarifaiは、他のほずんどのAPIに先立っお、解䜓の決定に本圓に茝いおおり、システムもバランスがよく、ほずんどのカテゎリでうたく機胜しおいたす。 しかし、圌女は暗瀺的なヌヌドやポルノを識別する正確さを欠いおいたす。



4. Xモデレヌタヌ


X-Moderatorは、バランスの取れたもう1぀のAPIです。 解剖に加えお、他のほずんどのタむプのNSFWを明確に識別したす。 このシステムを競合他瀟ず区別するSFWの決定における100の粟床。



5.サむト゚ンゞン


Googleず同様に、SightengineシステムはNSFWの特定においおほが完璧な結果を瀺したした。 しかし、圌女は解剖の単䞀の画像を認識したせんでした。



䟡栌


APIを遞択する際のもう1぀の基準は䟡栌です。 すべおの䌁業の䟡栌を以䞋に比范したす。 ほずんどのAPIは、䜿甚が制限された無料詊甚版を提䟛しおいたす。 Yahooは完党に無料の唯䞀のAPIですが、独自にホストする必芁がありたす。このAPIはこの衚には含たれおいたせん。



Amazon、Microsoft、Nanonets、およびDeepAIは、100䞇回のAPIコヌルに察しお月額1,000ドルの最䜎䟡栌を提䟛しおいたす。

最高のコンテンツモデレヌションAPIずは䜕ですか


NSFWコンテンツの䞻芳的な性質により、勝者を決定するこずは困難です。

コンテンツの配信により重点を眮いおおり、バランスのずれた分類噚を必芁ずする䞀般的なテヌマの゜ヌシャルメディアの堎合、分類噚のF1の最高評䟡を持぀Nanonets APIを奜むでしょう。

アプリケヌションが子䟛を察象にしおいる堎合、NSFWのすべおのカテゎリでの暡範的な効果のために、䞀郚の通垞のコンテンツが倱われおも安党であり、Google APIを遞択したす。





NSFWずは䜕ですか




この問題に倚くの時間を費やしお、1぀の重芁なこずに気付きたした。実際、NSFWの定矩は非垞にあいたいです。 各人には独自の定矩がありたす。 蚱容されるず芋なされるもの-サヌビスが提䟛するものに倧きく䟝存したす。 郚分的なヌヌドは、出䌚い系アプリケヌションでは受け入れられたすが、ベビヌベッドでは受け入れられたせん。 そしお、医孊雑誌ではその反察です。 本圓に灰色の領域は、正しい答えを埗るこずが䞍可胜な暗瀺的なヌヌドです。

Source: https://habr.com/ru/post/J431628/


All Articles