登录注册
下一个Kimi!
轻点一支烟
奉旨割肉的剁手专业户
2024-03-24 13:13:45

【阶跃星辰资料整理】

公司概况:

上海阶跃星辰智能科技有限公司于 2023 年 4 月成立,位于上海徐汇区,已完成 Step-1 千亿参数语言大模型和 Step-1V 千亿多模态大模型的研发,在图像理解、多轮指令跟随、数学能力、逻辑推理、文本创作等方面性能达到业界领先水平。

          

主要产品:

目前公司共推出四项产品,分别为 Step-1V、Step-2、跃问与冒泡鸭 AI

Step-1V:千亿参数多模态大模型

能够理解图像内容,并声称文案;分析数据图表并进行推理;联网进行智能搜索;理解长文内容,总结核心观点。

Step-2:万亿参数语言大模型,MoE  大模型

万亿参数 MoE 大模型是一个重大突破,苹果公司刚刚发布的模型只有百亿参数。除了苹果,目前最强的开源 MoE 模型是 Mistral8x7B,其性能可与 LLaM:70B 相媲美。Mistral 的另一款更大参数的 MoE 模型 Large 没有开源,但其性能被认为介于 GPT3.5 和 GPT4 之间,可能在 8x 几十 B 左右,对标单个模型参数大几千亿级别。此外,有内部消息称,国内某大厂去年训练两轮 MoE 后效果不佳,目前没有上线对外或内部使用,尽管该大厂已经处于领先地位。关于引发生成式 AI 热潮的 GPT4 本身,有研究者猜测它可能是 MoE 模型或 MoE 蒸馏后的模型,如果是 MoE,可能是小千亿模型 X8 后实现比其他家更强的万亿效果。

跃问:

由阶跃星辰开发的聊天机器人,能够理解用户的问题和请求,并提供有帮助的回答。能够理解图像内容,但不会绘画。可以不重复回答,并按照用户要求的格式输出信息,生成精美的 markdown 格式总结,以帮助用户快速抓住要点。目前可免费使用。能够进行文字交流、理解图片内容与文档内容,并进行整理总结,在图片理解部分可以根据搜索补充未表述完善的信息,对图片中的概念进行更详细的解释。

冒泡鸭 AI:

聊天机器人,能够理解和回答各种问题,包括知识性问题、实用性问题和日常对话。能够翻译和提供详细信息。可以进行图片、语音搜索。与跃问的区别在于冒泡鸭 AI 注重知识性问题、实用性问题和日常对话。跃问更专注于回答特定领域的问题,如技术问题或学术问题。目前可免费使用。    

公司团队:

注册法人:姜大昕

微软副总裁、前微软亚洲研究院首席科学家。2007 年,加入微软亚洲研究院任首席研究员,在机器学习、数据挖掘、自然语言处理和生物信息学等方面拥有多年的研究和工程经验,曾获得 2008 年 SIGKDD 最佳应用论文奖。2011 年,转入 STCA(微软亚洲互联网工程院),并于 2017 年成为微软全球合伙人,担任 STCA 副院长及首席科学家。

姜大昕带领团队在 2019 年将 Bing 智能问答功能,由十几种语言、扩展至全球 100 多种语言和 200 个地区,提高 Bing 使用的包容性和可访问性,从而引导用户在网络文档中获得最简洁、最准确的答案,进一步节省用户的时间和精力。    

          

【阶跃星辰发布万亿参数 MoE 语言大模型Step-2】

阶跃星辰发布万亿参数 MoE 语言大模型Step-2。3月23日的2024全球开发者先锋大会上,通用大模型创业公司阶跃星辰正式对外亮相。阶跃星辰创始人、CEO姜大昕博士在大会上正式对外发布了Step-2万亿参数MoE语言大模型预览版。模型采用 MoE 架构,聚焦深度智能的探索,并提供API接口给部分合作伙伴试用。训练万亿参数模型体现了阶跃星辰的核心技术能力,也表明阶跃星辰在通用人工智能领域追赶OpenAI的实力和决心。阶跃星辰的核心团队来自微软,技术实力深厚。阶跃星辰成立于2023年4月,创始人是姜大昕博士,曾在微软工作长达16年,主攻研究搜索、NLP等智能算法。公司的数据团队核心骨干大部分来自必应搜索引擎,曾支持全球 100 多种语言,为 200 多个国家和地区提供服务。


对模型进行Scale Up并非易事,要做好四方面准备。在过去的一年,一些国内领先的大模型基本达到了 GPT-3.5 的水平,业内也开始不断向着GPT-4的能力去突破。但 GPT-3.5 只是一个千亿参数的模型,要达到 GPT-4 的万亿规模参数,各个维度的要求都上了一个台阶,对算力、系统、数据和算法四大要素都有着极高要求。根据阶跃星辰数据,至少需要等效 A800 万卡单一集群,高效稳定的训练,十万亿 tokens 高质量的数据,加上驾驭新颖的 MoE 架构,任何一环出现短板,就很难将模型Scale Up至万亿参数。    

阶跃星辰具备打造万亿参数模型的坚实基础。公司通过自建机房+租用算力,积极进行算力储备;核心团队曾实践过单集群万卡以上的系统建设与管理。训练千亿模型的 MFU(有效算力输出)达 57%;数据团队对全球互联网高质量语料的分布有深入了解,并建立起强大的数据处理和知识图谱流水线;团队不仅能驾驭各种架构,比如万亿参数的 MoE 架构,并且对大模型的认知以及发展路线有深刻洞察。综合了多方面的准备和一年的沉淀,阶跃星辰才能在2024年实现了模型的“阶跃”。


阶跃星辰的Step系列模型已经开放试用。截至目前,阶跃星辰已经推出了Step-1千亿参数语言大模型、Step-1V 千亿参数多模态大模型,以及 Step-2 万亿参数 MoE 语言大模型的预览版,提供 API 接口给部分合作伙伴试用。Step系列模型在图像理解、多轮指令跟随、数学能力、逻辑推理、文本创作等方面性能达到业界领先水平。根据官网链接,阶跃星辰提供了名为“跃问”的聊天机器人平台,基于Step-1V多模态模型,用户可以直接体验模型能力。比如输入一张电影的截图,跃问就可以对图片内容进行描述,并能够知道是哪一部电影。但是目前Step-1V还只能理解语音、图像等多模态信息,无法实现生成图像。


阶跃星辰还提供了聊天陪伴智能体平台,支持自由创建不同风格的智能体。冒泡鸭是由阶跃星辰推出的免费AI聊天智能体平台,基于Step系列模型,能够理解和回应用户提问,旨在为用户提供智能、互动性强的伙伴。目前冒泡鸭有网页版和移动端App两种方式可以使用。用户可以自由根据自己的喜好定制智能体的外观、声音和对话风格,智能体可以通过流畅的对话以及接近真人的AI语音输出来模拟人类交流方式,提供自然真实的对话体验。通过冒泡鸭平台也可以发现别的用户创建的优质智能体,直接开启交流。

作者利益披露:转载,不作为证券推荐或投资建议,旨在提供更多信息,作者不保证其内容准确性。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
中文在线
S
新华传媒
S
电广传媒
工分
0
转发
收藏
投诉
复制链接
分享到微信
有用 4
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
评论(1)
只看楼主
热度排序
最新发布
最新互动
  • 只看TA
    03-24 16:47
    别下一个了,一个周末下十个都有了
    0
    0
    打赏
    回复
    投诉
  • 1
前往