Vision AI

Vision AI

Google Cloudが提供する画像に対するAIと機械学習のサービス群。
大きく2つのプロダクトを提供(機械学習モデルのトレーニング自動化と画像認識に関するAPI)

特徴

  • Google側で作成済みのモデルを利用したAPIにより、画像分析が可能
  • APIで解析出来るものは文字・顔(年齢、性別、感情)、ランドマーク、ロゴ、ラベル(含まれるシーンや物体など)などの機能を提供
  • 不適切なコンテンツの検出もAPIで可能
  • 機械学習のモデル作成(AutoML Vision)では、自身で準備した学習データをもとにモデルのトレーニングが可能
  • 学習データの準備用の機能も提供。画像データをアップロードし、担当者にWebUIから写真にラベルを依頼する業務フローまでサポート

情報テーブル

提供源/会社名 -
歴史 -
業界トレンド 既に学習済みのモデルから画像解析をAPIで実施出来るため、一般的な画像分類などの用途での利用が多い。モデルのアップデートも進んでおり、日本語の解析等にも強くなっている傾向。
細かい分類のルールが必要な場合は、AutoMLの機能によりモデルの作成が可能で便利だが、学習データの準備などが必要なため緩やかに利用が進んでいる。
情報分量 ・十分
・Googleの公式ドキュメントが充実している
技術選定ポイント ・Googleの提供する画像モデルが利用可能
・公式サイトで画像解析のデモが可能
・モデルの作成もWebUIから作成可能
・学習用データ作成のラベリングツールによりデータ準備の効率化
導入会社 -
セキュリティ -
料金 -
技術者数 少ない。
利用シーンが少ないため、経験者は多くないが、利用自体のハードルは高くない。
技術・導入難易度 APIもAutoMLも利用自体の難易度は高くないが、モデルの精度を上げるといったモデル自体のコントロールの難易度は高い。
採用トレンド -
参考 https://cloud.google.com/vision?hl=ja#industry-leading-accuracy-for-image-understanding
https://cloud.google.com/vision/docs/features-list?hl=ja