先说结论
1.奥拓电子(002587)董秘实锤是英伟达chatgpt最新技术的产品和服务商,英伟达周末最新chatgpt技术Project Mellon 1.0正式发布,探索创建由自然语音命令控制的XR体验!,并且奥拓电子客户除了英伟达,包含腾讯,META,微软等!下面会详细解释英伟达最新chatgpt技术Project Mellon,探索创建由自然语音命令控制的XR体验!
2.华为云盘古NLP大模型概念股:
奥拓电子(002587) 公司实锤与华为在语音识别服务、ASR服务、语音合成TTS服务、自然语言NLP服务、对话机器人服务合作,正好是华为盘古NLP的业务,也是日后接入华为CHATGPT的首批企业。公司全资子公司南京奥拓是华为云AI认证合作伙伴,将不断的推动公司智能视讯业务与人工智能技术的结合!另外奥拓电子还是华为鲲鹏合作伙伴!华为鲲鹏的常山北明,拓维信息已连板!
详细解释英伟达最新chatgpt技术Project Mellon,探索创建由自然语音命令控制的XR体验!
NVIDIA开始测试AI开发XR工具Project Mellon
那英伟达的Project Mellon是什么呢?
NVIDIA梅隆项目
NVIDIA的Project Mellon为交互式应用程序添加了自然语言命令。Project Mellon是一个轻量级Python包,利用大型语言模型(LLM)和语音AI的力量来改变用户体验。NVIDIA语音AI具有显著增强人机软件界面的能力。
梅隆项目是如何运作的?
这是一个典型的梅隆配置,显示了工具包如何使用NVIDIA RIVA进行自动语音识别(ASR)、文本到语音(TTS)和大型语言模型(LMM),如用于自然语言理解的NVIDIA NeMo服务(NLU),以将自然语言翻译为特定于应用程序的命令。
梅隆项目的主要特点和优势
对于开发人员:
零镜头语言模型意味着不需要训练语言模型
用于向应用程序的本机实现逻辑发出命令和参数的Python API
易于与多个LLM一起使用
自然语言允许更广泛的用户群体使用开发人员的应用程序
使用NVIDIA RIVA轻松扩展英语、西班牙语、德语和俄语的语音控制
对于用户:
使用自然语言命令和控制复杂的应用程序
能够使用远程服务进行自动语音识别(ASR)、文本到语音(TTS)和自然语言理解(NLU),本地安装只是一个小的Python包
沉浸在XR应用程序中不会受到侵入性GUI的阻碍
在扩展现实(XR)应用程序中启用语音命令
梅隆免除了对菜单系统的需要和对记忆手控制器功能的需要。人类用一种自然语言来控制自己的经验。
使用熟悉的界面简化用户体验
自然语言是最人性化的界面。使用梅隆工具包,用户可以只使用语音导航其他复杂的GUI。
轻松驾驭大型语言模型的力量
Mellon Python包重量轻,易于实现。一个简单的API将命令和参数传递给应用程序自己的实现逻辑。
不间断浸没
用语音命令取代视觉侵入性用户界面意味着对XR应用程序的深入、不间断的沉浸。
梅隆项目用例
扩展现实中的高管设计评审
不再需要训练用户操作内部控件和XR体验。用户可以简单地与体验对话来推动它,让广泛的用户能够身临其境地与数字资产进行互动。
虚拟生产
语音AI通过将艺术家从典型的仅限专家的按钮和菜单驱动的用户界面的限制中解放出来,促进了创造性的互动。使用简单的语音命令更改照明条件、相机参数、环境和场景。
机器人交互
机器人的语音远程控制意味着没有操纵杆,没有特定的控制器可以学习,只需与你的机器人交谈,帮助它完成工作。
NVIDIA XR解决方案扩展现实(XR)将改变我们享受娱乐、与朋友互动以及完成工作的方式。从游戏到产品设计再到电影体验,NVIDIA为增强现实(AR)和虚拟现实(VR)提供了突破性的解决方案,包括面向专业人士、游戏玩家和开发者的领先GPU、驱动程序和SDK。
英伟达CloudXR
云XR™ 是NVIDIA的解决方案,用于在远程服务器云、数据中心或边缘上从任何OpenVR XR应用程序流式传输虚拟现实(VR)、增强现实(AR)和混合现实(MR)内容。CloudXR流媒体解决方案包括NVIDIA RTX™ 硬件、NVIDIA RTX虚拟工作站(vWS)驱动程序和CloudXR软件开发工具包(SDK)。
英伟达Omniverse XR
英伟达Omniverse™ 提供了世界上第一次全保真度、全光线追踪的XR体验。开发人员和高级用户可以利用Omniverse Kit XR extensions的强大功能,将VR扩展和服务构建到他们自己的基于Omniverse套件的应用程序和项目中。
最终用户设计师、工程师和创作者可以使用Omniverse XR应用程序或带有Omniverse Streaming Client和View的AR在人类规模上制作3D虚拟世界。
NVIDIA VR捕获和回放
NVIDIA虚拟现实捕获和回放(VCR)使开发人员能够准确捕获和回放VR内容,用于性能测试、场景QC等。该工具在身临其境的场景中记录HMD和控制器输入,然后利用NVIDIA GPU在PC桌面或有线VR设备上回放完整体验。
NVIDIA语音AI
语音人工智能已经无处不在,从在联络中心的使用到在VR应用程序中添加语音命令,再到为数字化身提供类似人类的声音。NVIDIA提供Riva,这是一款语音AI SDK,用于开发语音识别和文本到语音管道,可提供世界级的准确性并实时运行
华为云盘古NLP大模型概念股