AI 时代值得关注的新变化是科技巨头纷纷开始自主研发 AI 晶片,一方面可能是科技巨头积累了大量资料价值待挖掘,另一方面是目前晶片算力不足且十分昂贵。美国为传统科技强国,FANG 中的 Google 正在领跑。中国网路巨头也大力发展 AI,阿里 AI 晶片进展最受关注。那幺,BAT 能否在 AI 晶片领域挑战 FANG?
FANG,Google 领跑Google TPU3.0中国有 BAT(百度、阿里、腾讯),美国有 FANG(Facebook、Amazon、Netflix、Google),所有科技巨头中,Google 的 AI 晶片 TPU 已更新到第三代。Goole I/O 2018,Google 首席执行长 Sundar Pichai 宣布推出 Tensor Processor Unit 3.0,并表示 TPU 3.0 的计算效能比 2017 年提升了 8 倍,可达 100PFlops(每秒 1 千兆次浮点计算)。
Sundar Pichai 没有透露关于 TPU3.0 更多细节,但可看到 Google 希望以 TPU 为基础,让 Google Cloud 像亚马逊 AWS 一样无处不在。TPU 3.0 公布不久,在 7 月 Google Cloud Next 2018 大会上,Google AI 首席科学家李飞飞宣布,Google 第三代 Cloud TPU 已进入 Alpha 测试阶段。这意味随着 TPU 更新,Google 正将更多 AI 技术应用到具体云端服务产品。
比起领跑的 Google TPU 已到第三代,亚马逊是在 2018 年 11 月底的 AWS re:Invent 正式发表机器学习晶片 Inferentia。AWS CEO Andy Jassy 表示,Inferentia 将是高吞吐量、低延迟、持续效能极具成本效益的处理器。Inferentia 支援流行的框架,包括 TensorFlow、Caffe2 和 ONNX,也支援多种资料类别,如 INT8、FP16 和混合精度。
身为亚马逊的产品,Inferentia 还支援流行的 AWS 产品资料,如 EC2、SageMaker 和新弹性推理引擎。亚马逊 Inferentia 会在 2019 年正式开卖。
Facebook 的进展则相对缓慢,2018 年 4 月,从 Facebook 官网可看到总部招聘 ASIC&FPGA 设计工程师,应聘者需有架构和设计半自订和全自订 ASIC 的专业知识,与软体和系统工程师合作,了解目前硬体的局限性,并利用专业知识打造针对 AI / ML、压缩、影片解码等多种应用的自订解决方案。
2018 年 9 月,彭博社报导称 Facebook 聘请 Shahriar Rabii 担任副总裁兼晶片负责人,Rabii 之前任职于 Google,并参与 Pixel 手机 Visual Core 等晶片开发。
虽然 Facebook 并未说明 AI 晶片研发的进展及目标,但 Facebook 的 AI 晶片首先还是会服务社群网路,包括透过 AI 技术对发表到社群网路的照片脸部辨识,对文字档即时翻译及说明和理解照片和影片内容等。
Netflix 为网路影片串流的 OTT 服务公司,未查到相关的 AI 晶片专案。不难看到,美国四大科技巨头在 AI 晶片的进度有差别,Google 领跑,亚马逊发表晶片并于今年投入使用,Facebook 则尚未公布 AI 晶片进展,Netflix 无相关资讯。
BAT 目标远大,但尚未见到晶片平头哥引发巨大关注与美国四大网路巨头 FANG 类似,中国三大网路巨头 BAT 的 AI 晶片进展也不同。去年初,中兴禁售事件引发全民对中国缺晶的讨论,讨论火热时,2018 年 4 月 19 日阿里巴巴达摩院宣布研发名为 Ali-NPU 的神经网路晶片,达摩院称 Ali-NPU 神经网路晶片性价比超过传统 CPU、GPU 的 40 倍,将应用于影像影片分析、机器学习等人工智慧推理计算。
次日(4/20),阿里巴巴又宣布全资收购杭州中天微系统有限公司,后者是一家内嵌式 CPU IP 供应商。消息公布后,中天微系统有限公司 CEO 戚肖宁博士表示,加入后会跟阿里巴巴这强大的技术平台和生态结合,儘快推动中国晶片商业化,同时把 CPU 用到各种物联网应用场景。
5 个月之后(9/19),阿里一年一度的云栖大会,阿里巴巴集团 CTO、达摩院院长张建锋宣布,阿里巴巴成立独立晶片公司「平头哥半导体有限公司」,平头哥是中天微与达摩院晶片团队整合而成。张建锋表示,和达摩院一样,平头哥的目标也是最终独立化运作,推进云端一体化的晶片布局。
不过,这次阿里晶片进展受更广泛关注在于公司名称,「平头哥」是中国人为非洲草原蜜獾取的绰号,因胆子大、无所畏惧,世上愿意收容蜜獾的动物园屈指可数。不过阿里表示希望能学习牠的精神,坚信梦想。
据悉,阿里将在 4 月发表第一款神经网路晶片。
百度全功能昆侖晶片相比阿里一波接一波 AI 晶片消息,百度 AI 晶片只在发表时受到关注。去年 7 月 4 日 Baidu Create 2018 百度 AI 开发者大会,CEO 兼董事长李彦宏发表百度自主研发的 AI 晶片「昆侖」,包含训练晶片昆侖 818-300 和推理晶片 818-100。
百度在发表时称昆侖是中国第一款云端全功能 AI 晶片,也是目前业界设计算力最高的 AI 晶片。百度也同时公布了昆侖晶片的参数:三星 14 奈米製程,效能 260Tops,记忆体频宽 512GB/s;功耗超过 100 瓦特,由几万个小核心构成。百度表示昆侖晶片具高效、低成本、易用的特点,且比最新基于 FPGA 的 AI 加速器,效能提升近 30 倍。
百度之所以能在发表晶片时公布详细参数,是因已完成 Tape Out,不过我们知道这距离量产和大规模应用还有一定距离,所以昆侖晶片发表时并未看到样片。
腾讯则是 BAT 中没有自主研发 AI 晶片的公司,不过去年 8 月专注于人工智慧领域神经网路解决方案的燧原科技,宣布获得腾讯领投 Pre-A 轮融资 3.4 亿人民币。另外,腾讯也与阿里一起投资 Barefoot Networks 晶片。
小结简单回顾美国和中国科技巨头的 AI 晶片 2018 年进展,不难发现无论美国还是中国,科技巨头 AI 晶片研发目的有相似的地方,进展各不相同,Google TPU 已更新到第三代,处于领先地位,Netflix 暂无 AI 晶片相关资讯。阿里声势浩大但未见晶片,百度昆侖的量产值得期待,腾讯尚未有自研晶片的消息。
科技巨头都将目光转向 AI,而聚焦 AI 的关键就是 AI 晶片。虽然 Google TPU 具领先优势,但中国科技巨头目标远大,也能取得更多资料,最终能否转换为 AI 时代的优势?