晶羽科技-解读点评影视小说作品

微信
手机版

寒武纪芯片用途,寒武纪芯片作死

2023-12-15 04:40 作者:岑岑 围观:

辛超(ID: aichip001)文|袁昕

芯潮11月14日报道,在深圳高交会期间,AI芯片独角兽寒武纪推出面向边缘智能计算领域的AI芯片思源220(MLU220)和M.2加速卡产品,加速卡售价1999元。

边缘通常连接着各种传感器,传感器的数据往往是非结构化的,如视频、图像、语音等,难以直接用于控制和决策。因此,需要边缘AI计算来结构化非结构化数据,以进行控制和决策。为此,寒武纪专门设计了一款边缘AI计算的芯片。

至此,寒武纪AI芯片实现了云、边、端全方位、立体化覆盖。

01,峰值32 TOPS,功耗只有10W。

思源220是一款专门用于深度学习的SoC边缘加速芯片。采用台积电16nm工艺,尺寸为15mm x 15mm。基于寒武纪最新一代智能处理器MLUv02的架构,拥有32 TOPS(INT4)的峰值计算能力,功耗仅为10W,并支持通过低功耗技术进一步降低功耗。

思源220的高性能低功耗设计主要是因为思源220采用了寒武纪最新一代处理器架构MLUv02。

MLUv02架构基于片上NoC,在六个方面进行了改进和优化:

(1)提高单核的性能。通过重新设计运算电路,大大提高了运算指令的能效,单次计算功耗提高了8倍;

(2)节省内存和带宽,增加数据压缩和解压缩指令,大大节省内存容量和内存访问带宽;

(3)高度灵活,扩展了近百个指令集,功能更加强大灵活;

(4)精度可以选择。除INT8外,还增加了INT4和INT16两种精度的运算指令,可以根据需要灵活选择。在高性能场景下,使用更高性能的INT4,在高精度场景下,使用更高精度的INT 16

(5)增加了软件可管理的共享缓存,使得处理器核之间的通信可以直接由软件控制,使用内部共享Mem可以大幅优化多核性能;

(6)处理复杂数据方便,增加了灵活的转置指令,可以支持各种复杂数据预处理。

此外,思源220内置高性能CPU 4核ARM A55,主频1.5GHZ,集成了丰富的外设接口,包括:

(1)两个PCIe3.0 2×2接口,可以连接NVMe等各种高速设备;

(2)eMMC5.1 HS400,支持高速eMMC存储,最高400 MB/s;

(3)SDIO3.0,可以方便的连接各种存储设备和WIFI、蓝牙等无线设备;

(4)双千兆以太网口可以帮助客户实现双网口的方案,从而实现内外网的物理隔离,保护数据安全;

(5)LPDDR4X内存接口,保证计算数据的高速交互和低功耗。

随着5G和AI时代的到来,海量的数据处理需求推动AI硬件向边缘扩展。寒武纪副总裁刘道富认为,边缘计算主要带来三大优势:一是直接在边缘处理数据,大大降低了通信成本;二是时延大大降低,满足实时处理要求;三是保护数据隐私和安全,不需要将数据发回云端,减少数据泄露。

在这方面,MLU220 edge方案有三个优势:

(1)数据安全性高:本地智能数据处理和脱敏上传。

(2)低延迟:数据实时分析,结果即时反馈。

(3)高带宽利用率:数据边缘清理,智能分发,有效上传。

02.超小尺寸加速卡,只有u盘大小基于思源220。寒武纪推出了小尺寸的M.2加速卡,未来还会推出更高计算能力的产品。

思源220-M.2 Edge加速卡在一块只有u盘大小的卡上,可以提供8路高清视频的实时智能分析,计算能力16 TOPS(INT4),功耗仅为8.25W。

加速卡广泛应用于智能交通、智能电网、智能制造、智慧金融、无人机、工厂质检、智慧教育、智慧医疗、智慧零售等边缘计算场景,支持视觉、语音、自然语言处理和传统机器学习等AI应用。

客户可以通过标准的M.2接口快速部署到现有业务,实现业务的智能升级和边缘加速解决方案。

思源220芯片和板卡不仅具有高计算能力、低功耗、小尺寸的特点,还拥有成熟的软件栈和软件生态。

寒武纪云、edge、end芯片都采用统一的处理器架构、指令集和统一的软件栈,这三个领域的生态可以相互促进,形成正循环。

云为开发、调试和优化提供了完整的软件。在云端开发的程序可以方便快捷地部署到终端和边缘,解决了终端和边缘开发、调试和优化困难的问题。终端和边缘可以积累大量客户和开发者,反哺云生态,最终实现云、边、端生态的繁荣。

具体到思源220,软件栈在云端打磨了两代。通过端云一体化软件平台,思源220将继续支持寒武纪Neuware软件工具链,支持TensorFlow、Caffe、MXNet、PyTorch等业界主流编程框架。

它棒极了。编程环境可以直接定制计算资源,满足多样化的AI定制需求。

寒武纪方面表示,针对未来边缘计算、自动驾驶汽车计算、培训等不同场景,寒武纪将持续投入并推出更多AI处理器,持续为全场景提供更先进、灵活、快速、高效的AI计算产品和服务。

03.思源系列芯片四大优势本次高交会期间,寒武纪展出了最全的思源系列AI芯片产品,包括面向云的思源100和思源270,面向边缘的思源220。

今年6月,寒武纪发布了中国品牌“思源”和第二代云AI芯片思源270。去年,寒武纪推出了云AI芯片品牌MLU(机器学习单元)和第一代云AI芯片思源100。

总的来说,寒武纪思源系列有以下四个共同优势:

1、通用性好

通用智能处理器,支持各种深度学习技术和多模态智能处理(视觉、语音和自然语言处理),应用广泛。

2.结束云集成

率先提出“端云一体”的智能处理思路,彻底打通端云智能处理。终端和云芯片可以共享相同的软件接口和完整的生态。

3.高能效

与GPU处理器相比,采用针对深度学习和人工智能应用特点定制的指令集和处理器架构,能效比更好。

4.完美的软件开发环境

寒武纪为思源系列提供了一套成熟的开发环境Cambricon NeuWare,包括应用开发、功能调试、性能调优等一系列工具。

04.结论:填补国内边缘加速空白。自2018年5月发布第一代云AI芯片思源100以来,寒武纪已经完成了覆盖云(思源100、思源270)、边(思源220)、端(寒武纪1A、1H、1M处理器ip)的完整AI芯片布局,并已广泛应用于多个场景。

新推出的思源220为加速国内边缘市场又增加了一个新的选择。

相关文章