登录注册
拓尔思—企业级大模型+反恐+数据
斩仓就去当嘎嘎
2024-03-24 13:28:29
kimi的爆火 带来的是对于曾经认为的武大郎的新的认识 去年的千模大战到现在了无音讯 kimi作为鲶鱼 重新燃起来垂直大模型上的火拼

垂直模型爆发应该是情理之中却意料之外的 情理之中是我们必然要有我们自己的应用或者模型 意料之外是因为 知道要有但是不知道是谁 而kimi在最适合的时候出来点起了这把火,恰逢其时是他 但是应用也会很快百花齐放

接下来吹票环节

拓尔思 

 kimi的长文本能力有

阶跃的金融模型 也有

 

目前,公司的金融科技业务主要以“软件产品+大数据服务+订阅 SaaS 服务”的融合模式为客户提供服务。公司智能风控业务的用户已经覆盖了 5 大国有银行、3 大政策性银行、92%的股 份制商业银行。 报告期内,金融科技业务版块实现了经营业绩的大幅提升,营业收入较上年同期增长了 95.68%,其中传统业务稳中 微增,主要增长来自 AI 与数据业务,消保、风控延展类业务需求较为旺盛。公司基于自有的 110 亿+金融主题数据、百亿级产业指标数据、30 亿+产业要素明细数据、2 亿+产业动态本体、500+ 以上标引维度、10000+知识标引规则、10 万+产业标签作为专业训练数据,打造了金融专业大模型,主要功能覆盖智能 风控、智能客服、智能投研等业务场景。-来自半年报  

政务端模型第一

 公司在数字政府方面,省级政府网站群、政务公开平台等业务进入运维期,地市级政府网站集约化业务 与政务新媒体业务稳步增长,政务大模型的应用探索需求旺盛。公司将持续拓展生态合作,定位专精特新,基于云和数 据服务以及政务行业大模型开辟新赛道,增加新商机。在智慧监管方面,公司的防非处非 SaaS 云产品链条更加完整,经 济金融风险监测方面加大了业务创新探索,如基于大众媒体情绪和公开财务债务测算地方城投债务真实风险。在智慧水 利方面,公司控股子公司广拓公司推出了融合知识图谱与行业大模型的水利知识服务平台解决方案,得到多地水利部门 的高度认可。

拓尔思基于自有的 300 万+篇公文类数据、200 万+篇政策法规类数据、8000 万+篇政务资讯类数据等数据作为专业训 练数据,打造了政务专业大模型,主要功能覆盖公文辅助写作、政策大脑和新一代政务互动等业务场景。在公文写作过程中提供更快速、准确的帮助和建议,支持生成横跨多专业领域的内容建议、改进文章结构等,帮助 节省作者的时间和精力,并提高公文写作的效率。 基于公文标题和提示信息,依次完成公文概要、目录、目录内容的生成,形成公文写作结果。 支持基于输入的少量文字,自动生成内容连贯、富有逻辑的公文正文。 支持与内容编辑器集成,作为辅助写作助手与内容编辑过程实时交互;可指出不合适的词汇、修正语法错误、改进 句子结构,并提供更生动、吸引人的表达方式,提升内容的可读性和吸引力。自 1993 年成立发展至今,公司已在媒体、政府等行业深耕了 20 年以上,在金融、安全行业也厚植了 15 年以上,积 累了一大批行业头部标杆和优质用户,如媒体行业服务了 72%的中央媒体,61%的省级媒体,40%的行业媒体等用户;政 府行业服务了 80%的中央和国务院机构,60%的省级政府,50%的地市政府等用户;金融行业服务了 5 大国有银行、3 大政 策性银行、92%的股份制商业银行等用户;公安行业服务了公安部及 32 个省市 160 多个地市公安用户。长期的行业客户 深耕,推动了公司行业应用向纵深发展,业务主要聚焦在内容管理、大数据、人工智能、数据和云服务等领域。公司从 行业的关键场景切入,用大数据和人工智能技术解决最棘手的问题,为行业创造价值。 -(来自半年报)

数据应该也是前列了

公司基于自有的 1000 亿+互联网媒体资讯数据,100 亿+官媒数据,200 万+人民数据,14 大类知识标引规范, 12000+知识标引规则作为专业训练数据,打造了媒体专业大模型,主要功能覆盖内容生产智能助手、新一代搜索与推荐、 多模态传播与服务三大业务场景。

在数据服务方面,公司大力开拓大模型预训练数据集服务业务,以数据推送服务方式为全国大模型服务厂商提供优 质的中文预训练数据集。中文大模型训练需要优质且合法的数据资源,而网信办、具备新闻发布资质的单位以及其他组 织机构所发布的合法稿源、长期数据,无疑具备稀缺性。目前,公司拥有规模位列业界前茅的、经过领域知识加工的权 威高质量公开数据 1500 亿+,涵盖近 10 年来的报刊数据、互联网主流新闻数据、新闻资讯客户端数据、政府类门户网站 数据、权威第三方平台数据及行业资讯数据等。公司正积极与多家大模型头部厂商洽谈数据服务合作业务。未来,公司 有望为全国更多 MaaS 服务商提供不同垂直领域的高质量预训练数据服务

公司与深圳云天励飞技术股份有限公司(股票代码: 688343,以下简称云天励飞)签订了数据服务合作协议。公司以数据推送服务方式为云天励飞提供近两年广东省政务网 站(非全量)新闻、公文、公告、政策类数据数百万条,作为其大模型预训练数据集。大模型训练需要优质且合法的中 文数据资源,而网信办、具备新闻发布资质的单位以及其他组织机构所发布的合法稿源、长期数据,无疑具备稀缺性。 目前,公司拥有规模位列业界前茅的权威高质量公开数据 1500 亿+,涵盖近 10 年来的报刊数据、互联网主流新闻数据、 新闻资讯客户端数据、政府类门户网站数据、权威第三方平台数据及行业资讯数据等。公司正积极与多家大模型头部厂 商洽谈数据服务合作业务。未来,公司有望为全国更多 MaaS 服务商提供不同垂直领域的高质量预训练数据服务

垂直大模型

建设我国自有的主流媒体垂直领域大模型是落实国家科技创新发展战略的重要举措,也是对冲美西方 ChatGPT 人工智能 模型对我国意识形态领域冲击的必然选择。随着拓天.M 媒体行业大模型发布,大模型应用在媒体领域的落地将迎来新一 波商机。公司已经与传播大脑签定了战略合作协议,联合发布了“传播大模型”,后续双方将共同开拓该领域业务。另 外,公司已中标 日报某项目,在落地过程中,公司将与用户共创更多媒体 AIGC 应用。 

AI+

公司与知识产权出版社进行合作,在强化搜索引擎技术与数据资源优势基础上,重磅推出完全自主可控 的“拓知全球基因专利数据库”(以下简称拓知基因)。拓知基因目前涵盖全球 40 多个国家、地区和组织的生物序列相 关专利数据及 32 个公共资源库,包含 4.2 亿条专利基因序列及 11.9 亿条公共资源生物序列。系统支持生物序列检索、 序列比对、基因专利检索等丰富检索策略,提供多途径检索追溯、分析手段和辅助工具,以及检索分析报告的查看和下 载,并对基因序列和专利进行深加工,在支持基因序列融合检索基础上,支持多维度揭示基因专利等功能。拓知基因在 性能优势上具备数据范围广、检索策略丰富、系统功能强和图形展示更直观四大特点。典型应用场景包括纳米生物技术、 组织工程与再生、基因测序、基于细胞的检测、发酵工程、PCR 技术、色谱技术、生物医药的研发、基因治疗和诊断、 食品保健、农业育种、自然资源与环境、工业加工、生物信息学等多个领域

反恐

广拓公司作为国内泛安全大数据领域较早的开拓者,长期深耕公安、军工、政法和海关等泛安全领域业务,坚持以 “大数据+知识图谱+NLP+机器学习”为核心技术体系,以大数据智能应用的“开源情报+知识图谱行业应用”为业务发展 战略,努力开展业务创新及生态合作模式创新,全力推动公司在 AI 和知识图谱工程应用领域取得不断突破。当前,公司 也积极开展大模型在泛安全领域的应用,在不久的将来,大模型也将成为公司的核心技术之一。 在开源情报业务方面。广拓公司持续加强专业情报人才队伍建设,开源情报服务业务在全国各大区域不断扩张,市 场份额持续增长。同时,公司在泛安全领域努力寻求体制专家的合作,为公司开源情报业务更广泛的拓展提供强有力的 支撑。

调研

公司千亿级数据具有哪些特点?不同行业大模型的专业训 练数据有哪些差别? 回答:公司拥有千亿级“全、准、新”的无监督训练数据和微调优 化知识数据,可针对优势行业训练出高质量的行业大模型,为媒体行业 的内容生产与搜索推荐、金融行业的智能风控与投研、政府的政策分析 与公文辅助写作等垂直领域提供深度赋能,满足行业用户的专业化智能 创新需求。 在媒体大模型上,公司基于自有的 1000 亿+互联网媒体资讯数据, 100 亿+官媒数据,200 万+人民数据,14 大类知识标引规范,12000+知 识标引规则作为专业训练数据。 在金融大模型上,公司基于自有的 110 亿+金融主题数据、百亿级 产业指标数据、30 亿+产业要素明细数据、2 亿+产业动态本体、500+ 以上标引维度、10000+知识标引规则、10 万+产业标签作为专业训练数 据。 在政务大模型上,公司基于自有的 200 万公文、政策文件、政务办 事指南等数据作为专业训练数据。

公司专业大模型在出版传媒领域前景如何? 回答:在传媒出版领域,拓尔思长期服务人民出版社、人民教育出版社、 知识产权出版社等 23 家出版单位,主要为传媒出版用户提供大数据资源管 理、知识图谱等技术服务。各家出版单位积累了各自细分赛道的优质稀缺数 据资源,但同时大多数出版单位不具备自己训练垂类大模型的技术和资源, 并且对将信息数据交由第三方 MaaS 服务商训练而产生的数据泄露问题存在 顾虑,担心削弱其核心内容价值。公司在此过程中,可以成为出版业理想的 合作伙伴,一是公司与上述出版单位已建立起长期友好的伙伴关系,具备信 任基础;二是公司承建的大数据资源管理、知识图谱等平台正是出版业运行 优质稀缺数据资产的主要系统,公司熟悉出版业 IT 环境与数据特点;三是 公司自主研发的拓天专业大模型,支持私有化部署和信创,并对其进行了中 文特性加强、内容安全、价值观对齐等训练;四是公司拥有的媒体资讯数据、 产业数据、政策数据、风控数据等全域另类数据与出版业拥有的各自内容细 分独特领域数据,可以按专业维度进行融合训练,打造出不同专业领域的知 识助手;五是双方共同打造的垂类知识助手,以合作分成的方式进行联合共 创运营,可面向不同行业的从业人员、高校师生、研究机构、产业链企业等 提供专业的付费知识服务。目前,公司正在和多家合作出版用户积极推进联 合共创垂类知识大模型的事宜。近期数据要素相关政策和制度密集落地,公司在数据要素领 域有哪些发展规划?目前公司有哪些数据产品? 回答:拓尔思拥有完整的大数据基础建设产品线、丰富的行业 SaaS 服务集群和可靠的安全一体化平台。公司将以完善自身数据要素资源体 系、壮大数据要素应用体系及建立数据要素安全体系为发展目标,从资 源、应用、安全三个方面全面布局数据要素市场,在强化数据要素底座 基础、加强数据治理能力建设、提升数据要素变现能力三个方向重点发 力,致力于加速数据要素价值的释放。 基于对 1300 亿以上资源性数据资产,通用、行业/领域知识库大类 30 余种,以及 350 种以上深度学习算法模型的融合治理,目前,公司打 造了产业大脑、媒体资讯、网络舆情三大数据资产平台,为公司在网络 信息内容治理、金融监管、政务资讯服务、金融机构风控管理、智能媒 体服务、开源情报等领域的云和数据服务提供数智赋能。其中,媒体资 讯领域的“数家资讯大数据服务平台”通过聚焦传媒领域的数据场景云 服务,覆盖了从中央到地方等数百家媒体机构用户,成为媒体大数据的 国内市场占有率第一。

作者利益披露:原创,不作为证券推荐或投资建议,截至发文时,作者持有相关标的,下一个交易日内没有卖出计划。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
拓尔思
工分
1.26
转发
收藏
投诉
复制链接
分享到微信
有用 3
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
评论(2)
只看楼主
热度排序
最新发布
最新互动
  • 寻找预期差888
    一路向北的散户
    只看TA
    03-24 20:59
    666
    0
    0
    打赏
    回复
    投诉
  • 只看TA
    03-24 17:06
    谢谢分享
    0
    0
    打赏
    回复
    投诉
  • 1
前往