SAKURA™ AIアクセラレータ
EdgeCortix SAKURA-IIは、当社の低レイテンシのDynamic Neural Accelerator(DNA)により、業界最高の効率を提供する最先端のAIアクセラレータです。小さなフットプリントで優れた性能を発揮する低消費電力のシリコンデバイスで、高速でリアルタイムのバッチサイズ1のAI推論を必要とするアプリケーション向けに設計されています。
SAKURA-IIは、エッジで最も困難とされている生成系AIアプリケーションを処理するように設計されており、設計者は画像、テキスト、サウンドのような異種の入力に基づいて新しいコンテンツを作成することができます。標準的な8Wの電力エンベロープ以内で、Llama 2、Stable Diffusion、DETR、ViTのような数十億のパラメータモデルをでサポートし、視覚、言語、音声、その他多くのアプリケーションにおける膨大な数のエッジ生成系AI用途の要件を満たします。
SAKURA™の主な利点
SAKURA™ 技術仕様
性能 | サポート | 帯域幅 | オンチップ |
60 TOPS (INT8) 30 TFLOPS (BF16) |
Dual 64-bit LPDDR4x (8/16/32GB total) |
68 GB/sec | 20MB |
演算効率 | 温度範囲 | 消費電力 | パッケージ |
最大90%の 使用率 | -40C to 85C | 8W (標準値) | 19mm x 19mm BGA |
性能 |
60 TOPS (INT8) 30 TFLOPS (BF16) |
サポート |
Dual 64-bit LPDDR4x (8/16/32GB total) |
帯域幅 |
68 GB/sec |
オンチップ |
20MB |
演算効率 |
最大90%の 使用率 |
温度範囲 |
40C to 85C |
消費電力 |
8W (標準値) |
パッケージ |
19mm x 19mm BGA |
詳細はSAKURA-IIの製品概要をご覧ください
MERAソフトウェアは、畳み込みから最新の生成系AIモデルまで、多様なニューラルネットワークをサポート
トランスフォーマーモデル | 畳み込みモデル | ||
DETR DINO Whisper Encoder / Decoder DistillBERT DistilBert - SST2 Nano-GPT GPT-2 - 150M Distil-GPT-2 (HF) GPT-2 (HF) - 117M GPT-2 (HF) - medium / large GPT-2 - XL (HF) - 1.5B |
TinyLama (HF) - 1.1B Phi-2 (HF) - 3B Open-Llama2 (HF) - 7B CodeLlama (HF) - 7B Mistral-v0.2 (HF) - 7B Llama3 - 8B ViT (HF) / CLIP / Mobile-ViT ConvNextV1/V2 (HF) SegFormer Roberta-Emotion StableDiffusion V1.5 |
ResNet 18 ResNet 50/101 Big YoloV3 TinyYolo V3 Yolo V5/V6/V8 YoloX EfficientNet-Lite EfficientNet-V2 SFA3D |
MonoDepth - MiDaS U-Net MoveNet DeepLab MobileNet V1-V2 MobileNetV2-SSD GladNet ABPN SCI |
トランスフォーマーモデル |
DETR DINO Whisper Encoder / Decoder DistillBERT DistilBert - SST2 Nano-GPT GPT-2 - 150M Distil-GPT-2 (HF) GPT-2 (HF) - 117M GPT-2 (HF) - medium / large GPT-2 - XL (HF) - 1.5B TinyLama (HF) - 1.1B Phi-2 (HF) - 3B Open-Llama2 (HF) - 7B CodeLlama (HF) - 7B Mistral-v0.2 (HF) - 7B Llama3 - 8B ViT (HF) / CLIP / Mobile-ViT ConvNextV1/V2 (HF) SegFormer Roberta-Emotion StableDiffusion V1.5 |
畳み込みモデル |
ResNet 18 ResNet 50/101 Big YoloV3 TinyYolo V3 Yolo V5/V6/V8 YoloX EfficientNet-Lite EfficientNet-V2 SFA3D MonoDepth - MiDaS U-Net MoveNet DeepLab MobileNet V1-V2 MobileNetV2-SSD GladNet ABPN SCI |
SAKURA-IIモジュール&カード
SAKURA-IIモジュールとカードは、業界をリードするエネルギー効率と低レイテンシで最新のビジョンと生成系AIモデルを実行するように設計されています。
SAKURA-II M.2モジュールは、60TOPSの高性能エッジAIアクセラレータで、小型のM.2 2280フォームファクタを採用しており、スペースに制約のある設計に最適です
SAKURA-II PCIeカードは、ロープロファイル、シングルスロットのPCIeフォームファクターで、最大で120 TOPSの性能を実現する高性能なエッジAIアクセラレータです。シングルおよびデュアルのオプションがあり、最適な選択肢は必要な全体のパフォーマンスによって異なります。
「エッジでの情報処理における大きな変化を考慮すると、企業は今、データキュレーションとAIによる意思決定が一緒に行えるクラウドレベルに近いパフォーマンスを求めています。このような背景から、省電力でコストパフォーマンスの高いインテリジェントなソリューションを必要とするさまざまな分野の実用的なビジネスニーズが高まり、EdgeCortixのソリューションセットの市場機会はますます広がっています。データとデバイスの両方が世界的に急激に増加していることを考えると、既存のソリューションよりも桁外れに優れたエネルギー効率と低い総所有コストでパフォーマンスを実現できる業界をリードするIPポートフォリオを持ち、エッジAI市場に革新を起こしているEdgeCortixを今後サポートしていきたいと思います。」
ソフトバンクの先端技術研究所 所長である湧川隆次氏は、次のように述べています。「ネットワークインフラの性能向上と省電力化は、将来にかけて大きな課題です。EdgeCortixは、これらの課題を同時に解決するために必要なIPと技術に関する専門知識の両方を提供するパートナーとして期待しています。私たちは、今後も質が高いネットワークを提供するため、EdgeCortixと協力して、さらなる性能向上と省電力を実現する最適なアクセラレーターの研究を進めていきます」
「EdgeCortixは、市場において実にユニークなポジションにあります。主要な産業分野でAIアクセラレーションを活用した大規模なビジネスニーズに対応していることに加え、市場参入のためのソリューションをどのように開発するかというそのビジネス戦略が、大きな差別化要因となっています。半導体企業は少し近視眼的傾向があり、ほとんどの企業は、いかに素晴らしいソフトウエアのコードを提供するか、または、半導体のハード設計に注力しているかのどちらかです。しかし、EdgeCortixの特徴は、ソフトウェアとハードウェアIPの協調設計を行い、顧客のニーズに応じたソリューションを提供するというアプローチにあります。ソフトウェア中心のハードウェア・エコシステムで提供するこのアプローチこそが、同社の成長のキーであり、AIアクセラレーションの分野では他に類を見ない企業です。」
シリコンバレー・ジャパン・プラットフォーム エグゼクティブ・コミッティ・メンバー
「業界全体において、AI/機械学習のワークロードがかつてないほど増加する中、業界を牽引するIPプロバイダであるEdgeCortixと共に提供するソリューションは、当社のIntel Agilex FPGAベースの製品ポートフォリオを完全なものにします。当社の顧客は、現在だけでなく、将来の様々なビジネスニーズにおいて、リスクやコストを下げながら、パフォーマンスを向上させることができるという高い水準のAI推論ソリューションを求めていました。」
「多くのお客様がAI技術を含むアプリケーションソフトウェアを実装することが予想される ため、RZ/V MPUシリーズにMERAコンパイラと関連ツールセットを追加することに価値が あることをすぐに認識しました。お客様のニーズを満たすためにイノベーションを推進する 当社では、EdgeCortixと協力し、堅牢で高性能かつ柔軟なAI推論ソリューションを迅速にお 客様に提供します。EdgeCortixは素晴らしいパートナーであり、継続的な関係を築くこと で、我々とエンドユーザーに大きな価値をもたらすであろう今後の機会と可能性に期待して います。」