グローバルエッジクラウドプラットフォームのリーダーである Fastly, Inc. (NYSE : FSLY) は本日、初の AI ソリューションとなる「Fastly AI Accelerator」の提供開始を発表しました。Fastly AI Acceleratorは、大規模言語モデル (LLM) アプリケーションの類似プロンプトを使用することで、パフォーマンス向上とコスト削減を支援し、開発者のエクスペリエンス改善を実現します。
ソフトウェア開発業界を対象とした米国の調査会社 RedMonk の主席アナリストである Stephen O’Grady 氏は次のように述べています。「AI テクノロジー全般、特に LLM は目覚ましい勢いでテクノロジー業界に革新 をもたらしており、開発者を含む世界中の何百万人もの人々の日々の働き方に影響を与えています。最大規模のモデルに多くの注目が集まる一方で、多くの開発者や企業が、中規模および小規模のモデルにも目を向けています。コスト削減、トレーニングサイクルの短縮、より限定されたハードウェアプロファイルでの実行など理由はさまざまですが、中小規模のモデルが重要な選択肢となりつつあります。」
Fastly AI Accelerator は、インテリジェントなセマンティックキャッシュによって、API コールの回数とコストを削減します。Fastly エッジクラウドプラットフォーム上に構築され、業界をリードするキャッシュ技術を活用した Fastly AI Accelerator は、専用の API ゲートウェイを使用し、ChatGPT をはじめとする人気の高い LLM やその他のモデルを使用するアプリケーションのパフォーマンスを飛躍的に向上させます。
一般的な AI アプリケーションは、毎日何十万件もの API コールや質問を処理することが可能です。ユーザーによる質問の多くは非常に類似しており、過去に質問されている可能性があります。セマンティックキャッシュを使用しない場合、LLM を呼び出すたびにプロバイダーに戻って情報を取得する必要があり、コストとレイテンシーが増大しかねません。Fastly AI Accelerator のセマンティックキャッシュ機能は、繰り返されるクエリに対して、AI プロバイダーに戻らず、Fastly の高性能エッジプラットフォームから直接キャッシュされたレスポンスを提供するため、コストを抑えながらパフォーマンスを向上させることができ、より優れたエクスペリエンスを提供することが可能になります。
Fastly の Developer Experience 担当バイスプレジデントである Anil Dash は次のように述べています。「Fastly では常に開発者の声に耳を傾け、彼らが何に期待し、何が最大の課題であるかを理解しようとしています。Fastly AI Accelerator は、開発者が好む LLM のエクスペリエンスを大幅に加速させ効率化します。これにより、開発者はアプリケーションやサイトの独自性を高め、ユーザーの満足度向上に専念できるようになります。」
開発者は新しい API エンドポイントを使用する際にアプリケーションを更新し、コードを 1 行変更するだけで Fastly AI Accelerator を使用できます。その後 Fastly AI Accelerator は、OpenAI と互換性のある API のセマンティックキャッシュを透過的に実装します。従来のキャッシュ技術を超えるアプローチが採用されているため、Fastly AI Accelerator はリクエストとクエリのコンテキストを理解し、内容が似ている2 つ以上のリクエストに対して類似したレスポンスを送信できます。
また Fastly は、開発者がより高速かつ安全で、魅力的なエクスペリエンスを構築できるよう、無料アカウント枠を拡張し、より簡単に Fastly をお試しいただけるようにします。これにより、コーダーは新たなサイトの設定、新しいアプリケーションの作成、新しいサービスの立ち上げをわずか数分で行うことが可能になります。無料アカウント枠には、Fastly のコンテンツ配信ネットワーク (CDN) へのアクセスに加えて、十分なメモリとストレージの割り当て、無制限のリダイレクト、ページルール、正規表現へのアクセスも含まれます。さらに TLS や常時稼働の DDoS 対策、オブザーバビリティツールなどのセキュリティ機能も含まれています。
Fastly AI Accelerator やその他の Fastly のイノベーションの詳細については、 fastly.com/ai をご覧ください。Fastly の無料トライアルについては こちら からお申し込みください。
Fastly について
Fastly のパワフルでプログラマブルなエッジクラウドプラットフォームは、Webパフォーマンスの向上、セキュリティ強化、そしてグローバル規模でのイノベーションを促進するエッジコンピュート、デリバリー、セキュリティ、オブザーバビリティの提供を通じて、世界のトップ企業による高速で安全かつ魅力的なオンラインエクスペリエンスの実現を支援しています。 Fastly の強力かつ最先端のプラットフォームアーキテクチャにより、開発者は安全なWebサイトやアプリケーションの市場投入までの期間を短縮し業界トップレベルのコスト削減を実現できます。国内では日本経済新聞社、ぐるなび、ZOZO、サイバーエージェント、海外では Reddit、Wendy’s、Stripe、Universal Music Group など、世界的に著名な企業が Fastly のサービスを通じてインターネット体験を向上させています。Fastly の詳細については https://www.fastly.com/jp をご覧ください。また、X @FastlyJapan および Facebook でも最新情報をご覧いただけます。