闲芯芯闻 - "优化多核平台的AI推理性能：技术分析与策略"

"优化多核平台的AI推理性能：技术分析与策略"

2024-01-09 103 小闲

不久前，边缘人工智能（AI）推理作为一种新奇的功能，可以轻松地由单个神经处理单元（NPU）IP加速器支持。然而，人们对此的期望已迅速提高。现在，我们希望嵌入式AI推理能够处理多个摄像头，复杂的场景分割，带有智能噪声抑制的语音识别，多个传感器之间的融合，以及现在非常大和复杂的生成式AI模型。

只有在多核AI处理器上运行，这些应用程序才能为边缘产品提供满意的吞吐量。NPU IP加速器已经可以满足这个需求，扩展到8个或更多的并行核心，并能够并行处理多个推理任务。但是，你应该如何对预期的AI推理工作负载进行分区，以最大限度地利用所有这些计算能力呢？

我们首先从AI推理目标的资源集开始，这些资源包括一些可用的加速器，具有本地L1缓存，共享L2缓存和DDR接口，每个缓存的缓冲区大小都已定义。接下来的任务是将应用程序要求的网络图映射到这种结构，优化总吞吐量和资源利用。

有一种明显的策略是处理需要分割成多个瓦片的大输入图像—通过输入地图划分，其中每个引擎被分配一个瓦片。在这里，多个引擎并行搜索输入地图，寻找相同的特性。相反，你可以通过输出地图划分—将同一瓦片并行输入多个引擎，并使用相同的模型但不同的权重在同一时间检测输入图像中的不同特性。

在面对一些具有线程操作的AI推理模型或子图时，虽然这些操作并不显得很可并行化，但仍然可以进行流水线处理，这在考虑通过网络执行流操作时可能会有益。

另一个例子是深度神经网络（DNN）中的逐层处理。简单地组织每个图像的层操作以最小化每个引擎的上下文切换可以提高吞吐量，同时允许后续的流水线操作稍后但仍然比纯顺序处理要早地切入。基于转型器的生成性AI网络提供了另一个好例子，注意和规范化步骤的交替使得可以对连续的识别任务进行流水线处理。

批量分区也是一种方法，支持在多个引擎上运行同一个AI推理模型，每个引擎由一个独立的传感器供食。这可能支持一台监控设备的多个图像传感器。并且最后，你也可以通过让不同的引擎运行不同的模型进行分区。这个策略尤其有用于语义分割，例如，对于自动驾驶而言，部分引擎可能会检测车道标线。其他引擎可能处理开放（可驾驶）的空间分割，而另一部分可能会检测物体（行人和其他车辆）。

在优化吞吐量和利用率方面有很多选择，但是你应该如何决定最佳的AI推理应用调优方法呢？这一架构规划步骤必须在模型编译和优化之前进行。这里，你需要在分区策略之间做权衡。

例如，一个子图可能先并行，然后进行一系列的操作，有时最好仅通过流水线处理，而不是并行和流水线处理的组合。每种情况下的最佳选择将取决于图，缓冲区大小，以及上下文切换中的延迟。在这里，支持实验是确定最佳实现的关键。

芯片品牌：英特尔，型号：Core i9，适用领域：视频编辑和游戏
芯片品牌：AMD，型号：Ryzen 9，适用领域：3D建模和渲染
芯片品牌：Nvidia，型号：GeForce RTX 2080，适用领域：高清游戏和VR
芯片品牌：Qualcomm，型号：Snapdragon 865，适用领域：移动设备
芯片品牌：Apple，型号：A14 Bionic，适用领域：手机和平板电脑
芯片品牌：华为，型号：麒麟990 5G，适用领域：5G手机

抑制温室气体排放的新观念：逆行链的去碳化

2024-01-09

"全新77GHz汽车雷达IC：开启空间卫星式架构的新篇章"

2024-01-09

热门标签

微芯公司荣获Chips Act资助 12月同比减少近10%" MwT重振旗鼓标题：日本或邀请台积电设立3纳米工厂增强自身半导体生产能力" 非苹果客户也纷纷下单影响部分驾驶功能威马汽车申请破产重整新思科技成功揽走工程软件巨头Ansys 标题：东风李尔智能汽车座椅产业园年产26万套座椅正式运营首次突破！2024年全球半导体产能将飙升至每月3000万片 "化学品供应商努力应对美国扩张计划的挑战" 华为余承东内部信暗示2024年是鸿蒙OS关键之年 "Rambus DDR5时钟驱动器：提升数据速率至7200 MT/s" TI公司在消费电子展上发布新款汽车芯片法院正式出面调解 "应用Berry相位磁单极子工程技术开发高温自旋电子设备" "英特尔代工压力增？小摩警示：英特尔外包台积电订单或超代工争抢" 2024年电子元器件供应链展望：亮眼开局伴随挑战全新虚拟增强现实技术：高通推出Snapdragon XR2+ Gen 2平台估值达350亿美元标题：日本大地震波及新唐晶圆厂 "NASA无人机研究瞄准未来空中出租车市场" "半导体行业元老Richard Hegberg担任Aspinity首席执行官" 2024年SEMICON West大会聚焦美国芯片行业投资增长日本地震后的Tower Semiconductor公司最新更新标题：650V超结构MOSFET：效率的新标杆标题：ODM厂家雪祺电气的市场策略：顺应美的、小米 "瓦伦斯半导体"揭幕全新品牌形象 "关键锻造厂"变身为"SK 关键锻造厂" 南亚科预言：2024年DRAM市场将迎来强劲复苏摩根大通对台积电目标定价升高迎接Gaudi与Falcon Shores 三大业务助力年度运营增长" 揭秘200瓦级AC-DC电源转换新技术无需主动钳位实现零电压开关半导体股强劲攀升标题：2023年AI带动半导体市场飞速成长推行降价政策以稳固客户关系而美欧考虑设立限制文晔科技收购富昌电子获中国无条件批准近半企业感受到正面效益" 大手笔引领科技新未来标题：“云端巨头自主研发芯片：能否削减成本？” 颠覆传统的量子计算：开启新纪元的芯片设计 "南亚科技最新财报：单月营收创新高 "威刚科技2023年业绩小降共同打造AI芯片新纪元" "Nasa走向全新太空站的建设之路" 损失情况待评估标题：環球晶恢复日本新潟工厂生产 "印度IPO市场青出于蓝胜于蓝" "Tektronix 4系列B MSO：更强大的处理能力与更高的数据传输速度" 性能惊人 "ST微电子的ToF测距传感器：高效能与低功耗并存" "超越30亿片/分钟：2024年全球半导体产能预测" Apple-TSMC-Amkor协议助力美国芯片供应链崛起 "Chroma ATE: 创新测试的多功能性发展" "欧洲芯片法案引领创新与供应链弹性：SEMI ISS Europe 2024探索洞见" 大阪或横滨更可能成为选择 "嵌入式IP带动Wi-Fi 7在物联网领域的应用" "轴空间"完成D轮4400万美元融资标题：实现汽车智能驱动器的最优性能：配平电流的重要性 "Percepio与Lynx软件强强联手" AMD斥资50亿在台建立研发中心 x86雄霸能否自救？" 助力人才战略储备" "2024年台积电销量预计年增24% 中国汽车制造商加大非汽车规格晶片应用 "SkyWater向美国CHIPS科技计划提交申请 2024年底产能目标上修至80%" "瑞银预测：AI产业利润猛增英特尔锐进微电子产业：即将公布18A后续制程开发计划 "ARM风起外资继续看好其未来发展" "三星发展智能监控 "石墨烯半导体问世：全球首个功能性实例" "高性价比显微投影光刻系统：高精度制造的新途径" 英特尔积极部署新举措" "优化多核平台的AI推理性能：技术分析与策略" "新型有机电化学晶体管性能的优化研究" "鋒魁科技有望在2023年实现超过23%的收入增长" 收购日本光刻胶巨头JSR的进程延后闲芯平台 "2024年产业战略座谈会聚焦半导体行业的万亿美元增长机遇" 美光爆料：GDDR7记忆体技术风暴即将来袭 "台湾晶片法案"：台积电等公司将享受有史以来最大的税收优惠标题：半导体行业协会赞扬美国政府对CHIPS行动计划立场的调整韩法院着手提高法律责任透彻挖掘细分行业高成本或成致命伤为ADAS提供驱动" "全球半导体容量将于2024年创新高 "汽车内部体验的晋升：汽车人机界面测试的力量" "10兆日元俱乐部"日企数量创历史新高 "微电子科技人物专访：MA-tek首席执行官谢容芬博士" "苹果明月初份即将发售激动人心的Vision Pro头显" 抑制温室气体排放的新观念：逆行链的去碳化揭秘：中国碳化硅产能“泛滥”究竟如何冲击全球半导体产业？ "Revasum Inc联手Asahi Diamond America 重塑硅碳化物晶圆研磨技术" "美国向微芯科技注资16.2亿助其提升半导体生产力" 标题：软件定义车辆的未来趋势：左移和右拉美国"选择美国"计划达成2000亿美元外资投资大关标题：武汉敏声打造高端射频滤波器生产线投资30亿推动产能提升积累合计突破143亿元 "高防护性能光继电器：80伏1.4安的DIP封装" "全国集成电路及先进制造技术员学徒计划启动 "钙钛矿LED引领未来激光技术新方向" "NXP引领边缘设备间的软件互通性" "TI处理器上的GPU计算 2024年第一季度DRAM价格预计大幅调整标题：CML Micro风波后合作伙伴已尝鲜股市欢庆一度暴涨标题：场可编程门阵列（FPGA）安全现状与挑战将科幻变为现实五年内将取得迅猛增长" 目标2030年实现芯片生产全自动化" 东京电子初级岗位薪资上涨40% 推动数据中心基础设施的下一步演进 "SSD选择时刻 "USI打造全新规模无人工厂创十年最高纪录 "OPPO澄清中国区总裁刘波的工作岗位没有改变" "智能仓储助力广运订单满负荷至2028 韩国半导体出口12月同比增长21.8%" 新唐仍在进行设备检查 "BT探索将电动车充电点加入路边机柜的试验" "日本熊本地区受益于台积电扩产标题：中国寻求扩大电动车出口市场 "2023年印度电子工程时代新闻热点回顾" JIC计划至2024年2月下旬启动标题：压力之下的美国制造业：劳动力成本上升与持续萎缩未来电商霸主将现：元器件平台的胜负手比亚迪纯电动汽车销量首度超过特斯拉中国率先开建18座晶圆厂" "2022年智能手机芯片战争：Snapdragon 8 Gen 3对垒Dimensity 9300" "2024年：AIGC应用期盼巅峰年度营收下滑近半" "台积电3纳米工艺积累新订单 "韩国8英寸芯片代工厂Key Foundry更名为SK keyfoundry" 西门子、sureCore及Semiwise联手开发低温半导体设计但未能超越新宝、比依 000份餐食" "博世半导体前厂长出任台积电欧洲子公司总裁" "格林威特推出通用高性能半导体选材：Chemraz 541" 年产愈增30% 标题：华为新款笔记本内含之谜：其5纳米芯片源于台湾非中国大陆 "DRAM报价猛涨标题：展望2024年：科技大潮即将到来标题：美国计划放宽H-1B签证限制以增强海外招聘力度 "2024年内存价格显现反弹趋势" 标题：Rambus推出新一代RCD "SRAM在新型存储器中的作用与前景" "全新77GHz汽车雷达IC：开启空间卫星式架构的新篇章" "浙江大芯片"：中国科学院设计出256核心处理器标题：三星代工厂对抗台积电英特尔重塑未来：告别Ponte Vecchio 马斯克的脑机接口植入人体 "为解决芯片工人短缺 "美国设新型H-1B签证缓解半导体行业人才荒困扰" 杜邦荣膺三星电子最佳ESG合作伙伴奖汽车电子*NXP*工控*云计算震动全球半导体供应链的日本大地震：多家大厂静待复工助力科技制造业飞跃" "Skyworks: 推出能大幅降噪的可伸缩软件" 展望未来可扩展至1600核心显著提升 "自主研发芯片的门槛越来越低：ARM的荣光与x86的黄昏时刻" 标题：半导体检测巨头泛銓再开新厂沃时电子揭秘分销商逆境之策：多品牌战略成"过冬"法宝标题：LG携手Magna "SK海力士计划发行美元债券筹集10亿美元资金" 标题：TDK风投引领创新潮流新型电动车充电余流监测器的模拟与数字输出颠覆性技术：NEO半导体带来3D X-DRAM新机制 "DigiKey联手Conductive Containers为难民提供39 "全球半导体月产能突破3000万片总体表现亮眼" "神经形态处理器联手Microchip微型处理器：一场视觉与声音的AI对话" "与众不同：世芯科技在车用和边缘AI领域的未来展望" 拜登-哈里斯政府与微芯科技达成初始协议提供芯片援助 AI生成技术的优化挑战标题：韩国半导体技术泄露中国 "智原科技正式加入Arm Total Design 英特尔大举投资望翻身 "施乐持续优化运营模式 "增强型像素提升光谱仪传感器灵敏度" "汽车电子化转型：中心化存储在区域式汽车架构中的关键角色" "聯電2023年年度营收降幅超20% 康博电子技术策略：提升分销优势计划裁员超3000人" 创新合作：Porotech选择ClassOne Solstice平台加速微LED产品研发揭秘医疗级新贵：P-DUKE推出MAD50系列智能手机*5G*苹果*存储芯片*AI CES上展示自动驾驶电脑刷新内存带宽新高度 Visa计划进行大调整" Infineon与Wolfspeed扩大硅碳供应协议肩负未来能源愿景新型光隔离MOSFET驱动器获汽车认证性能大幅提升 "MACOM 任命Raj Shanmugaraj加入其董事会" 达到每月3000万片晶圆" "日本半导体专家正式加入SEMI约五" "欧洲芯片大户Presto Engineering荣获ISO27001认证" 投资新加坡科技巨头Silicon Box及其颗粒封装技术三星和美光筹谋2024年首季调涨15%-20%" NAND Flash价格上涨影响终端市场" 揭秘铜基超导体之谜：40年科学难题有望破解？ "Bourns 公司：引领传感器创新之路" "史无前例