黑芝麻智能还推出了自研NPU新架构——“九韶”,支持新一代通用AI工具链BaRT和新一代双芯粒互联技术BLink。九韶NPU采用大核架构,支持智驾大模型的实时推理,支持包括INT8/FP8/FP16在内的混合精度,集成了针对高精度精细量化和Transformer的硬加速,简化了开发者在量化和部署过程中的工作。BaRT支持多种流行框架和模型的转换,原生兼容PyTorch的推理API,支持Python编程部署,支持业界主流的Triton自定义算子编程,允许开发者使用Python语言编写Triton自定义算子,进一步加速AI模型的部署。BLink技术支持Cache一致性互联的高效C2C技术,能够扩展支持更大规模模型的算力需求,为算法长期演进做好准备。