処理

言語モデル

言語モデルは、人間の言語を理解・解釈・生成できる高度なAIシステムです。これらのモデルは膨大なテキストデータセットで訓練され、パターン、語の組み合わせ、文構造、さらにはさまざまな言語と言語使用の微妙なニュアンスを学習します。多くの現代的な言語モデルの核はトランスフォーマーアーキテクチャで、自己注意機構を用いて、特定の文脈でどの部分が重要かを判断します。

言語の処理において、これらのモデルは統計的方法を用いて、テキスト内で最も起こりそうな次の単語や最も起こりそうな次の文を予測します。長いテキストにわたる文脈を理解できるため、文法的に正しいだけでなく、内容的にも整合性があり関連性の高いテキストを生成できます。

たとえばチャットボットやテキスト生成器として言語モデルを使用する場合、モデルには特定のプロンプトや初期データが与えられ、それに基づいて文脈から論理的に続くテキストを生成します。これらのモデルの目的は、内容とスタイルの両方で、できるだけ人間らしく見えるテキストを生成することです。

テキストから画像へのモデル

テキストから画像へのモデルは、書かれたテキスト記述から写真、イラスト、その他のタイプの視覚的表現を生成できるAIシステムです。これらのモデルは高度なニューラルネットワークを利用し、特に生成的対向ネットワーク（GAN）やその変種である拡散モデルを用います。

プロセスは、ユーザーが入力したテキスト説明から始まります。モデルはこのテキストを評価し、その意味と文脈を理解しようとします。次に、テキスト記述に対応する画像を、訓練中に学んだ知識を活用して生成します。膨大なテキスト-画像ペアのデータセットで訓練されます。

訓練中、モデルはテキスト記述と視覚的特徴との関連を学習します。例えば、モデルが「黄の太陽が青い海の上にある」という語の組み合わせを、これを描く画像と何度も組み合わせて見た場合、これらの要素を未来の画像創作で識別し再現することを学びます。

結果として、入力テキスト記述に対してしばしば非常に正確で詳細な画像が得られます。これらのモデルはますます洗練され、複数の物体や抽象的概念を含む複雑なシナリオを表現できるようになります。芸術的な創作、ゲームデザイン、仮想現実など、幅広い用途で使用されます。

AI-Public が提供するモデル

AI-Public は、巨大なテクノロジー企業によって API を通じて提供されるさまざまなAIモデルを公開していることを理解しておくことが重要です。API（アプリケーション・プログラミング・インターフェース）は、ソフトウェア同士が通信できる規則と定義のセットです。情報を交換し、機能を相互に呼び出すための「言語」のようなものとして機能します。AI-Public 自身は言語モデルやテキストから画像へのモデルを持っていません。

私たちはさまざまなモデルの結果について責任を負いません。とはいえ、企業向けに最良かつ最も興味深いモデルを選定することには注意を払っています。

処理手順

回答を生成するためには、以下の手順を実行します。

ユーザーがプロンプトを作成します。
フロントエンドのウェブアプリケーションがこれをアクティブなチャットに接続し、ステータス「初期化済み」のチャットメッセージを追加します。
AI-Public のサーバー上で、チャットメッセージの追加によって機能がトリガーされます。
チャットメッセージのステータスが「処理中」に設定されます。
ドキュメント付きのチャットを選択した場合、サーバーは最初にFirestore ベクトルデータベースへリクエストを送信し、ドキュメントからテキストを抽出します。
次に、選択された言語モデルへAPI連携を介してリクエストを送ります。
設定がストリーミングの場合、受信した10チャンクごと、そして100チャンク受信後の25チャンクごとにメッセージを保存します。
全体の回答を受け取ったら、ステータスを「完了」に設定します。
フロントエンドアプリケーションはデータベース更新ごとにリフレッシュされます。
エラーが検出された場合、ステータスを「エラー」としてエラーメッセージを表示します。

私たちは各 API リクエストに個人データを送信しません。ただし、ユーザーがプロンプトやアップロードされたドキュメントに個人情報を含める場合があります。

言語モデル​

テキストから画像へのモデル​

AI-Public が提供するモデル​

処理手順​

言語モデル

テキストから画像へのモデル

AI-Public が提供するモデル

処理手順