Google のプログラムにはクラウドベースの AI ツールキットも含まれています。 Vertex AI Studio は、広範な AI モデル ポートフォリオ、 検索拡張生成(RAG) などの「モノ」の簡単なサポート、その他のさまざまな興味深い機能を約束します。 Google のGenerative AIキットを詳しく調べました。

Google Vertex AI スタジオとは何ですか?

テスト済みの Google Vertex AI Studio

Vertex AI Studio は、Generative AI (GenAI) モデルを構築およびテストするための Google Cloud コンソール用のツールです。オンライン環境では、 プロンプトを設計し、アプリケーションのニーズに合わせて AI モデルを調整することもできます。 Vertex AI Studio は、さまざまな独自のオープンソース AI モデルに依存しており、さまざまな目的のために事前トレーニングされたAPIも提供します。これらは、Google Cloud コンソールのほか、Python、Node.js、Java、Go の API 経由でも使用できます。 AI モデルは、 Vertex AI Extensionsを介してリアルタイム データとプロセスにリンクすることもできます。ただし、後者の機能は現在まだ (プライベート) プレビュー段階にあります。

以下の Google 独自の LLM が Vertex AI Studio で利用可能です (特に)。

この記事の後半では、Vertex AI Studio のこれらおよびその他の AI モデルについて詳しく説明します。

Vertex AI Studio の競合製品には次のものがあります。

テスト済みの Google Vertex AI Studio

以下のスクリーンショットからわかるように、Google の Vertex AI Studio の生成 AI ワークフローは、「入力、出力」よりも少し複雑です。 Google のResponsible AI の取り組みとセキュリティ フィルターは入力と出力の両方に適用され、悪意のあるプロンプトと回答からユーザーを保護することを目的としています。

クエリを処理する基盤モデルは、事前トレーニングまたはカスタマイズできます。さまざまな方法が使用できますが、比較的時間がかかります。 Retrieval Augmented Generation を使用して AI モデルを「グラウンディング」する必要がある場合、これは生成 AI ワークフローの一部として行われます。

テスト済みの Google Vertex AI Studio

Vertex AI Studio を構成する

RAG を有効にするには、Vertex AI Studio でいくつかの手順を実行する必要があります。

  1. まず、Vertex AI Search and Conversation での「オンボーディング」を完了する必要があります。これは数回クリックし、数分間待つだけで実行できます。

  2. 次のステップは、AI 検索データ ストアを設定することです。これは、ウェブサイトのクローリング、BigQuery テーブルおよびクラウド ストレージ バケット(PDF、HTML、TXT、JSONL、CSV、DOCX、または PPTX 形式)からのデータ インポート、または API 呼び出しを通じて実行できます。

  3. 最後に、RAG をサポートするプロンプトと AI モデルが必要です ( PaLM 2など)。これは、AI 検索および会話データ ストアを使用するように構成する必要があります。

Vertex AI API を使用している場合、この設定はパラメーターのgroundingConfigセクションにあります。

テスト済みの Google Vertex AI Studio

{

"instances": [

{ "prompt": "PROMPT"}

],

テスト済みの Google Vertex AI Studio

"parameters": {

"temperature": TEMPERATURE,

"maxOutputTokens": MAX_OUTPUT_TOKENS,

"topP": TOP_P,

テスト済みの Google Vertex AI Studio

"topK": TOP_K,

"groundingConfig": {

"sources": [

{

テスト済みの Google Vertex AI Studio

"type": "VERTEX_AI_SEARCH",

"vertexAiSearchDatastore": "VERTEX_AI_SEARCH_DATA_STORE"

}

]

テスト済みの Google Vertex AI Studio

}

}

Vertex AI Studio コンソールを使用している場合は、以下のスクリーンショットに示すように、詳細プロンプト パラメーター セクションに設定があります。

Vertex AI Studio の独自の AI モデル

Vertex AI Studio が約束する価値の大部分は、Google 独自の大規模言語モデルに関連しています。最も重要なものを一目で説明します:

  • Gemini は、Vertex AI Studio における Google の「主力」LLMであり、Google によると、Gemini Pro、Gemini Pro Vision、Gemma と同様に最も強力なモデルであるさまざまなバージョンで利用可能です。

  • Imagen 2は「前例のないレベルのフォトリアリズムと言語の深い理解」を備えていると言われています。 Google Brain Research のテキストから画像への拡散モデルは、DALL-E 3 や Midjourney 6 などと競合します。

  • Chirp は、2B パラメータを持ち、100 以上の言語を転写できる汎用言語モデルのバージョンです。また、音声音声をフォーマットされたテキストに変換したり、ビデオに字幕を付けたり、エンティティ抽出やコンテンツ分類のために音声コンテンツを文字起こししたりすることもできます。

  • Codeyにはさまざまなバージョンもあります。たとえば、プログラム コード補完(code-gecko)、 コード生成(code-bison)、またはコードに関するチャット(codechat-bison) などです。 Codey API は、 Go 、GoogleSQL、 Java 、 JavaScript 、 Python 、TypeScript など、さまざまなプログラミング言語をサポートしています。 Codey は、GitHub Copilot、CodeLlama、ChatGPTcoding、CodeWhisperer など、およびプログラミング作業用に設計された他の LLM と競合します。

  • PaLM 2 はテキスト(text-bison および text-unicorn)、 チャット(chat-bison)、およびセキュリティ固有のタスク (sec-palm、現在は招待のみ) のバージョンで利用できます。最大の PaLM-2 モデルである text-unicorn は、コーディングや思考連鎖などの複雑なタスクに適していることが特徴です。

  • 埋め込みモデルは、 Google Vertex AI Studio でテキスト タスク(texttembedding-gecko および textembedding-gecko-multilingual) とマルチモーダル タスク(multimodalembedding) に使用できます。 ベクトルデータベース(Vertex AI Search) と組み合わせることで、セマンティック検索、類似性検索、RAG の実装が可能になります。

Vertex AI モデル ガーデン

テスト済みの Google Vertex AI Studio

Google 独自の AI モデルとは別に、約 90 のオープンソースモデルと約 40 のタスク固有のソリューションが (現在) Vertex AI Studio のいわゆる「 Model Garden 」を通じて利用可能です。 Google の社内 AI モデルは Vertex AI API、Vertex AI Studio コンソール、Google Colab を通じて利用できますが、オープンソース モデルは通常 Colab Enterprise を通じて利用でき、エンドポイントとしてデプロイできます (多額の料金が発生する場合があります)。 。 API は使用量に基づいて課金されます。

提供される基本モデルには、たとえば次のようなものがあります。

  • ラマ2、

  • 安定した拡散 v1-5、

  • クロード 3 ソネット (プレビュー中)、

  • クロード 3 俳句 (近日公開) も

  • クロード 3 オーパス (近日公開)。

細かく調整可能なモデルには次のものがあります。

  • PyTorch-ZipNeRF (3D 再構築)、

  • AutoGluon (表形式データ)、

  • LoRA (Text-to-Image) も安定した拡散

  • MoViNet ビデオ アクション認識。

Vertex AI Studio でのプロンプトとモデルの調整

プロンプト エンジニアリングに関する Google のオンライン チュートリアルでは、プロンプト デザインに関して考慮すべき事項について、包括的かつ一般にベンダー中立的な概要が提供されます。

以下では、Google Vertex AI Studio の 3 つのプロンプトの例を見ていきます (マルチモーダル、テキスト、画像処理用に 1 つずつ)。

基本モデルを独自の目的に適合させるために、最初に迅速なエンジニアリング手法を使用することは、ほとんどの場合に価値があります。このステップが失敗した場合、AI モデルを微調整するオプションが残ります。 Google は、このトピックに関する包括的なオンライン ガイドも提供しています (Vertex AI Studio リファレンスの有無にかかわらず) 。

AI テキスト モデルを微調整するために、Vertex AI Studio は現在 2 つの方法をサポートしています。

Google では、分類タスク、センチメント分析、複雑でないコンテンツの集計、ドメイン固有のクエリには前者の方法を推奨しています。一方、RHLF は、(複雑な) 質問に答え、より難しいコンテンツを要約して生成することを目的としています。コーディング分野の AI モデルの場合、教師あり学習が唯一の選択肢です。 Fine-Tuning セクションを無料でテストしたい場合は、Google Colab でこの Python クイックスタート チュートリアルを使用してテストできます。

さらに、Vertex AI Studio を使用すると、 埋め込みモデルを調整したり抽出されたテキスト モデルを作成したりすることもできます。後者では、大規模で強力な「教師」モデルと、ラベル付きまたはラベルなしのトレーニング データセットを使用して、小規模だがより正確な「生徒」モデルをトレーニングします。

すべてのプロンプトと微調整が失敗した場合でも、事前トレーニングを継続するオプションがあります。これには、ラベルのないデータを使用できるという利点がありますが、多くのサンプルが必要になるため、時間と費用がかかります。

Google Vertex AI Studio – テストの結論

Vertex AI Studio により、Google は Amazon Bedrock や Azure AI Studio の強力な競合となる可能性のある有望な製品を作成しました。

このソリューションのさまざまな利点には、Google 独自の AI モデルの使用、他のプロバイダーからの新しいモデルの迅速な採用と展開、RAG とモデルの最適化の簡単なサポートなどが含まれます。ただし、あまり肯定的ではないのは、Vertex AI Studio の機能の大部分が現在、限られた範囲でしかアクセスできないことです。これは、とりわけ、潜在的に最も有用な機能である Generative AI Extensions に影響を与えます。

すでに Google Cloud に多額の投資を行っている場合、まだアクセスできない機能や限られた範囲でしかアクセスできない機能に依存する必要がない限り、Vertex AI Studio は AI アプリケーションを作成するための明白なオプションです。 Vertex AI Studio のコストは、使用状況によって異なります。

Google Vertex AI Studio の利点と欠点の概要:

あたり:

  • AI アプリケーションを開発するための優れたオンライン環境。

  • 40 を超える独自の AI モデルと 60 を超えるオープンソース モデルを提供します。

  • 検索拡張生成とモデルの微調整を簡単にサポート。

  • 他のプロバイダーからの新しい AI モデルのタイムリーな採用と展開。

短所:

  • AI 拡張機能などの製品の重要なコンポーネントは、現在、限られた範囲でのみアクセスできます。

(FM)