FFI8805 Premium
FlowforestNEXT-GEN PRODUCT

FFI8805 Premium

CIM AI 가속기 × SSD 스토리지 — 포괄적 LLM 솔루션

FFI8805 Premium은 CIM AI 가속 코어와 AI 인식 SSD 컨트롤러를 통합하고, DeepSeek V4 Engram 영구 메모리 엔진과 DualPath 듀얼 채널 대역폭 최적화를 탑재한 포괄적 LLM 추론 하드웨어 솔루션입니다.

10%
JCT 감소
52%
처리량 향상
268
GPU 확장성
8%
에너지 효율 향상

LLM 추론의 3대 병목

DeepSeek V4 등 초대규모 모델이 조 단위 파라미터를 넘어서면서 기존 GPU + DRAM 아키텍처는 메모리 용량, 스토리지 대역폭, 운영 비용의 3가지 병목에 직면하고 있습니다.

메모리 벽

671B 파라미터 모델은 1.2TB+ 메모리가 필요합니다. 단일 노드 GPU HBM 용량이 크게 부족하고 KV-Cache는 컨텍스트 길이에 따라 선형적으로 증가합니다.

스토리지 대역폭

Prefill 단계에서 SSD에서 수백 GB의 모델 가중치를 로드해야 하며, 기존 단일 경로 PCIe 대역폭이 주요 병목이 됩니다.

운영 비용

대규모 GPU 클러스터의 전력 및 냉각 비용이 계속 상승하여 토큰당 추론 비용을 상업적으로 실행 가능한 수준으로 낮추기 어렵습니다.

CORE TECHNOLOGIES

3대 핵심 기술 기둥

FFI8805 Premium은 3가지 혁신 기술을 통합하여 모델 메모리, 데이터 경로, 스토리지 미디어 전반에서 LLM 추론을 최적화합니다.

PILLAR 1 · MODEL MEMORY

DeepSeek V4 Engram 영구 메모리 엔진

Engram은 DeepSeek V4가 도입한 네이티브 영구 메모리 메커니즘으로, 고빈도 지식을 O(1) 쿼리 가능한 구조화 메모리로 압축하여 KV-Cache의 선형 성장을 대체합니다.

O(1)
메모리 쿼리 복잡도
14.8T
학습 토큰
5.2×
메모리 압축률
671B
모델 파라미터

V4 vs V3 벤치마크 향상

MMLU+3.4
BBH+5.0
HumanEval+3.0
MATH+2.4
Multi-Query NIAH+12.8
DualPath Storage Bandwidth Optimization for LLM InferenceLeveraging Idle DE Nodes & RDMA for Enhanced Performance≫ Path 1: PE Read Path (Traditional)SSDSSD Storage(PE Node)?DataDRAMPE DRAM(Host Memory)?NVLink/PCIeHost Interconnect?PE→GPUGPU HBMGPUGPUGPUPE to GPU Transfer?DualPathOptimization HubFFI8805 PremiumSRAM-CIM + Engram Engine?GPU ClusterLLM Inference ProcessingGPUGPUGPUGPUGPUGPUGPUGPUGPU?≫ Path 2: DE Read Path (Innovative)SSDSSD Storage(DE Node)?DataDE DRAMData Engine DRAM(Idle DE Node)?CNICConverged NetworkInterface Card?RDMARemote DirectMemory AccessDE→GPU Direct?DE→GPU Direct Access45.62%JCT Reduction (Job Completion Time)2.25xThroughput (vs Traditional)1,152GPU Scale(Scalability)LEGENDPE Path (Cyan): Traditional Read Path — SSD → PE DRAM → NVLink/PCIe → GPU HBMDE Path (Amber): Innovative DualPath Read — SSD → DE DRAM → CNIC → RDMA → GPU Direct AccessGPU Cluster: LLM Inference ProcessingDualPath Optimization Hub: FFI8805 Premium
PILLAR 2 · DATA PATH

DualPath 대역폭 최적화

DualPath는 AI 학습 클러스터의 유휴 DE 노드 SNIC을 활용하여 SSD→DE DRAM→CNIC RDMA→GPU의 제2 데이터 경로를 엽니다.

45.62%
JCT 감소
2.25×
처리량 향상
1,152
GPU 규모
PILLAR 3 · STORAGE MEDIA

AI 인식 SSD NAND IP 아키텍처

5계층 AI 인식 아키텍처는 NAND 어레이부터 가속 계층까지 전면 재설계되어 SSD 컨트롤러가 AI 워크로드 액세스 패턴을 이해합니다.

AI 액세스 패턴 인식Prefill/Decode/Checkpoint LLM 액세스 패턴을 자동 식별하고 NAND 스케줄링을 동적으로 조정
3단 바이오닉 캐시L1 SRAM + L2 DRAM + L3 SLC 3단 캐시, 적중률 β = 0.85–0.95
지능형 프리페치 엔진어텐션 패턴 기반으로 다음 KV-Cache 액세스 위치를 예측하여 고속 캐시에 사전 로드
니어 스토리지 압축NAND 컨트롤러 레벨에서 INT4/INT8 양자화 해제를 실행하여 PCIe 전송량 감소
FFI8805 Premium AI Accelerator + SSD Storage SolutionIntegrated 5-Layer Architecture: From AI Acceleration to NAND StorageCIM AI AcceleratorSmart SSD StorageLayer 1AI Acceleration LayerSRAM-CIM • 12 TOPS • EngramINT4/INT8/FP16/FP8?Layer 2AI Interface LayerAPIPCIe+ CXLNVMe?Layer 3AI Core LayerSRAM-CIM Array • 64MB On-Chip22nm Process • 3D SSD Extension?Layer 4QoS Control LayerOPTIMIZEMONITORTRAFFIC MGMT?Layer 5NAND Array Layer3D TLC/QLC NAND • 4/8/16 TB • AI-Aware Controller?AI AccelInterfaceAI CoreQoSNANDClick any layer for detailed specifications
HARDWARE SPECIFICATION

하드웨어 사양 개요

FFI8805 Premium은 CIM AI 가속 코어, SSD 컨트롤러, NAND 어레이를 단일 2.5" U.2 모듈에 통합합니다. 각 서브시스템의 전체 사양은 아래와 같습니다.

FFI8805 Premium 상세 사양

ComponentSpecificationPerformance

회원 전용 기술 자료

상세 사양, 메모리 계층, 기술 비교, 응용 시나리오, 로드맵은 로그인한 회원만 열람할 수 있습니다.