此文转载
海天瑞声是我国领先的训练数据专业提供商。自 2005 年成立以来,发行人始终致力于为 AI 产业链上的各类机构提供算法模型开发训练所需的专业数据集。发行人所提供的训练数据覆盖智能语音(语音识别、语音合成等)、计算机视觉、自然语言等多个核心领域,全面服务于人机交互、智能驾驶、智慧城市等多种创新应用场景。其中智能语音为发行人的优势领域,产品线已包含 160 余个主要语种及方言。
发行人主要从事训练数据的研发设计、生产及销售业务。发行人通过设计数据集结构、组织数据采集、对取得的原料数据进行加工,最终形成可供 AI 算法模型训练使用的专业数据集,通过软件形式向客户交付。发行人所属行业为软件和信息技术服务业。算法、算力、数据是人工智能技术发展的三大要素,其中训练数据是算法发展和演进的“燃料”。在当前技术发展进程中,深度学习算法是推动人工智能技术取得突破性发展的关键技术理论,而大量训练数据的训练支撑则是深度学习算法实现的基础。深度学习分为“训练”和“推断”两个环节:训练需要海量数据输入,训练出一个复杂的深度神经网络模型;推断指利用训练好的模型,去“推 断”现实场景中的待判断数据,并得出各种结论。训练数据越多、越完整、质量越高,模型推断的结论越可靠。
海天瑞声的产品和服务已获得阿里巴巴、腾讯、百度、科大讯飞、海康威视、微软、亚马逊、三星等国内外客户的认可,应用于其研发的个人助手、智能音箱、语音导航、搜索服务、智能驾驶、机器翻译等多种产品相关的算法模型训练过程中。目前海天瑞声客户累计数量超 500 家,覆盖了主要的大型科技公司、人工智能企业及科研机构。
在智能语音、计算机视觉及自然语言三大领域中,智能语音领域训练数据为发行人最早开始生产、销售的训练数据类型,为发行人的优势领域和主要收入来源,2018 年、2019 年及 2020 年占训练数据定制服务整体收入比重分别达到79.95%、76.94%及 72.12%;随着发行人业务的发展壮大,与下游行业发展路径相适应,发行人也逐步将业务领域拓展至计算机视觉、自然语言领域。
报告期内各年,发行人前五名客户主要为人工智能产业链上的各类知名机构,如阿里巴巴、腾讯、百度、微软、三星、亚马逊、字节跳动等,各年前五大客户与发行人均不存在关联关系。2018 年、2019 年及 2020 年,发行人向前五名客户合计销售额占当期营业收入比重分别为 59.06%、53.88%及 50.25%,向单个客户的销售比例均不超过当期营业收入总额的 50%,不存在对单一客户的依赖。
2018 年至 2020年,公司出口美国的营业收入占当期公司营业收入的比重分别达到 12.96%、19.48%和 19.93%。
Image
募资用途
\
市场规模
根据艾瑞咨询发布的《2020 年中国 AI 基础数据服务行业研究报告》(以下简称“《行业研究报告》”),2019 年,以海天瑞声、百度众包为代表的国内基础数据服务行业前五大企业的市场份额为 26.2%。
Image
Image
据国际数据公司(IDC)预测,全球每年的数据量将从 2018 年的 33ZB 快速增加到 2025 年的 175ZB,年复合增长率达26.91%。其中,中国的数据量增速最快,平均每年的增长速度比全球快 3%。2018年,中国的数据量为 7.6ZB,占全球总量的 23.4%,预计到 2025 年将增至 48.6ZB,占全球总量的 27.8%,年复合增长率达 30.35%。
Image
业绩指引
经公司初步测算,公司预计 2021 年 1-6 月实现营业收入约 12,750 万元至14,025 万元,同比增长约 25.07%至 37.58%;预计实现归属于母公司股东的净利润约 4,650 万元至 5,115 万元,同比增长约 0.74%至 10.81%;预计实现扣除非经常性损益后归属于母公司股东的净利润约 4,185 万元至 4,604 万元,同比增长约 0.54%至 10.61%。
主要竞争对手
在美国市场,发行人面对的主要竞争对手有 Appen、Globalme、DefinedCrowd、Scale AI等;在日韩市场,发行人面对的主要竞争对手依然以 Appen、Globalme、DefinedCrowd 为主,同时还有一些本土的数据服务商如:Baobab(日本)和AIMMO(韩国)等。
虽然发行人在国内基础数据服务行业拥有领先的行业地位,但与国际大型训练数据公司,如 Appen 相比,发行人在营收规模、净利润规模、员工数量等指标上均小于 Appen,在体量上具备一定劣势。具体来看,Appen 2020 年度取得营业收入 5.99 亿澳元,净利润 5,051 万澳元,发行人同期取得营业收入 2.33 亿人民币,净利润 8,208.10 万人民币。截至 2021 年 4 月,Appen 员工总数为 1,100余人,同期发行人员工规模相对较小。此外,Appen 已在基础数据服务行业深耕 20 余年,相较于发行人而言开展业务的时间更久,语种或方言的覆盖能力更强。截至 2021 年 4 月,根据公开信息可查到的 Appen 覆盖的语种或方言数量已达 230 余个,高于发行人覆盖的 160余个。
Image
S:
Image
发行价36.94,165左右合理,257以上高估。
正儿八经的科技公司。