离线语音终端

让AI终端『会听+会说+会写』,无需网控,随时随地为万物发声

智能离线语音终端

深思维将语音唤醒(Wake-up)、语音识别(ASR)、语音合成(TTS)、自然语言处理(NLP)等人工智能技术集成应用于离线语音终端中,在无网络覆盖条件下实现本地对话的快速响应,满足用户与机器间的无障碍交流,为用户提供稳定、流畅的交互体验,是令数据保障更安全的智能离线解决方案。

off40

产品能力

Product features

离线自然语言处理

断网情况仍能流利进行人机交互对话,提升离线状态下用户交互体验,让智能不再受限于网络。

离线语音识别

内置高效ASR算法模型,实现离线状态下语音精准识别,专属识别模型准确识别大量垂直领域资料。

离线语音合成

无网环境,TTS算法平均推理延迟<0.01秒,合成速度快且语音不失真,给予用户自然流畅对话体验。

离线语音检测与唤醒

支持离线唤醒词设定,可快速唤醒设备并作出指定响应,大大提升人机交互的效率。

硬件设备支持

Product features

tu3off

嵌入式终端

典型设备:
NVIDIA Jetson Xavier NX NVIDIA Jetson NANO
90*103*35 mm19V2.37A

tu4off

边缘计算设备

典型设备:
华为Altas 500 pro 智能边缘服务器

tu5off

AI服务器-Arm架构

典型设备:
华为Altas 800 训练服务器

tu6off

通用服务器-X86架构

典型设备:
联想(ThinkServer) 服务器

产品优势

PRODUCT ADVANTAGES

部署灵活

支持本地物理机部署环境,可实现微型设备集成,灵活嵌入各类商品之中。

模型可定制

可灵活配置对话模型,体验个性化互动,即配即用,无需训练。

数据安全

核心及保密数据本地运算和存储,避免数据泄露等安全问题。

毫秒级相应

语音识别及语音合成速度300-600毫秒,对话流畅自然,无延迟卡顿。

多轮对话

离线场景仍人机多轮灵活对话,真人一对一体验。

高性价比

一次购买即可获得永久授权的私有化产品。

GTC China大会初创“十二强”企业

深思维携智能离线语终端荣获“英伟达GTC China大会初创企业展示特等奖”

在会话AI领域,深思维借助NVIDIA Jetson环境下的CUDA能力,占用极少空间实现智能交互的同时,语音合成和语音识别仍能保证毫秒级响应,无网条件下仍能提供稳定、流畅、自然的智能对话体验。

深思维历时三个月,从全国近百家报名初创企业中脱颖而出,荣获"英伟达初创企业展示特等奖",晋级在GTC中国大会呈现的初创企业最终展示 "十二强"。

NVIDIA 人工智能开讲:专访深思维科技创始人兼CEO张曦,带你探索人机对话的无限潜力!

应用场景

THE SCENARIO

智慧军营
深思维为某部队设计在完全无网络覆盖环境下,能够进行多轮人机对话的特型机器人智能离线解决方案,满足部队在离线状态下教学、讲解、服务等场景所需要的机器人语音交互功能。
智慧消防
因火灾导致无网络或网络信号弱等突发状况时,植入深思维离线语音终端的消防机器人能够提供有效的边缘计算技术、离线语音指导、图像识别等功能,帮助现场指挥及救援工作。
智能家居
深思维研发团队将离线语音终端植入到智能家居场景中,实现在无网络链接,无APP控制时,离线语音唤醒家居工作台,通过边缘侧TTS、NLU技术,在保证个人隐私的前提下进行沉浸式互动对话操作。
智慧医疗
为智慧医疗系统、家庭健康系统提供沉浸式互动体验的离线语音解决办法,为系统注入AI技术能力,令服务侧(APP、挂号机、对讲机)提供更加准确、高效的健康咨询、挂号预约、病情跟踪等医疗服务。