海天瑞声是做什么的,数据标注。
以上横轴为数据量,纵轴为准确率,蓝色以及绿色线条分别代表深度学习以及传统算法。 根据Jeff Dean的预判,随着数据规模的不断扩大,未来深度学习算法的精度也将不断提升。也就是说,处在技术大爆发与数字洪水阶段,谁掌握了更多的数据、更精准的数据,那么谁的算法精度也就会更领先一步。
但一直以来,在AI的发展中,数据的采集与标注却始终在有意或者无意的被忽视着,乃至被边缘化。
但是在云测数据的总经理贾宇航看来,对于算法落地来说,“数据不仅充当饲料,同时也在逐渐充当婴儿的奶粉,运动员的优质蛋白一样,拥有了就可以更好的成长具备竞争力”而想要为算法提供足够优质的婴儿奶粉,并没有那么容易。
可以说,数据标注是人工智能的先行者,没有足够优质的数据,就投喂不出优质的人工智能。
海天瑞声已经打出了示范效应,其他数据标注的相关个股有补涨的机会。