🚀多模态Q4有望密集催化!安迪比尔,一分钟看懂产业变化和增量投资机会【天风计算机 缪欣君团队】
1.根据OpenAI官网,ChatGPT即将在两周内对plus用户与企业用户开放包括图像理解+生成以及语音对话能力。Chatgpt语音对话的能力仅对ios及安卓客户端开放,图片-文字这两种模态的融合正在逐步实现并对全平台开放,GPT-4中所表现的多模态能力从3月份到现在一直未对外开放,近期这一状态即将改变。
2、不同于以往的文-文对话,图-文交流和语音交流有了更多的模态和交互选择,现实生活中存在大量的非语言模态,而以图片、声音、文字为代表的多模态大模型有望解决这一问题,释放更多应用场景。
3、后续催化足,DALL-E3模型即将在10月份与ChatGPT结合,文生图也整合到chatGPT,此外10月份google有望对外发布下一代Gemini多模态大模型,据悉Gemini已经面向少量用户使用,OpenAI也将对外发布GPT-VISION,多模态大模型即将全面推广
我们看好包括应用和算力在内的AI赛道,尤其是多模态
(1)应用:金山办公、万兴科技、科大讯飞、新国都、虹软科技、海康威视、当虹科技、福昕软件
(2)算力:浪潮信息、神州数码、拓维信息、四川长虹、烽火通信、海光信息、寒武纪、景嘉微等
作者利益披露:转载,不作为证券推荐或投资建议,旨在提供更多信息,作者不保证其内容准确性。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。