当前位置: 首页 > 科技观察

靠打广告赚了大钱的墨迹天气,开辟了新的吸金方式

时间:2023-03-21 20:21:26 科技观察

【.com原创稿件】约会好友因为空气质量实时提醒被拒绝《墨迹天气(以下简称墨迹)》PM2.5指数爆炸面。和大多数工具类APP一样,墨迹也是各种简单粗暴的广告。根据墨迹2016年底提交的创业板招股书,广告收入占比超过95%,年利润超过2000万。可以说,押注广告赚了大钱。押注广告的变现方式真的能走多远吗?从墨迹的使用场景来看,其用户粘性和产品矩阵还有待完善,这将直接影响未来的广告转化率。近日获悉,墨迹从2015年底到2016年初开始布局B端业务,致力于公司积累的技术人才、海量气象数据和气象领域的研究,以及国家对气象领域的研究。对气象数据的开放。有特殊需求的行业提供企业级气象服务,将成为一种新的吸金方式。无论是C端的流量变现,还是B端定制化的气象服务解决方案,气象数据都是成功商业化的基石。墨迹高级技术总监王磊介绍,从塞班岛时代开始,墨迹APP从一开始就在积累数据,所有的原始数据都保存到今天。近四五年,细分领域的大数据越来越重要,墨迹也开始着力打造大数据平台和投入人力,试图从用户和天气预报中寻找模型和规律。海量气象数据。基于这些,进行个性化推荐,精细化服务,当然还有商业运营。海量气象数据的来源与分析对于气象预报,观测数据是充分必要条件,直接影响预报的准确性。观测数据的理想状态是观测点足够多,天气预报会更准确。比如在北京布置100个点,但是北京面积很大,点之间的温度和气压是多少?墨迹的数据主要来自三个来源:第三方气象机构、各种设备传感器、时间观社区。最好的方面是与其他气象公司合作,例如中国国家气象局,美国NOAA(国家海洋和大气管理局)的GFS,欧洲EC(欧洲中期天气预报中心),日本气象卫星数据,还有中国国家气象局的数据等。这些机构有全球观测数据,都是卫星遥感数据,所以质量比较高,每天的数据量在500G左右。第二个方面是各种传感器。比如墨迹C端用户的手机,基本上都有气压计和温度传感器。还有和外部通用汽车的合作,车上也有剩余的仪表和传感器,数量非常多。此外,魅族和华为手机也预装了墨迹App,可以从中获取相关数据。这部分数据量每天约8000万条,但由于形式不同,每台设备上的数据存在偏差波动,导致质量参差不齐,需要统一处理后才能投入使用。第三个方面是时间场景社区,即实时天气社区。每天约有10万张天气照片上传到时间场景社区,天气图片资源总量达到1亿级。数据分析墨迹的数据分析分为两部分,一部分是0-2小时的短期预测和2-8小时的短期预测。另一部分是8小时到15天的中长期预报。机器学习主要用于短期预测。它主要采用了目前业界比较先进的神经学习网络,比如利用FCN网络(全卷积网络)和Conv-LSTM网络(长短期记忆网络)等特定分支实现不同源的融合。数据的噪声被剔除,然后融合学习这些气象数据的历史变化趋势。短期预报除了C端用户可以在出门前查看实时天气外,B端用户还可以结合天气来节省成本,提高效率。墨迹商业化副总裁张明明介绍,交通运输、码头物流、农业等行业对短期预测的需求比较高。例如,在中石油的物流配送案例中,双方将历史气象数据与中石油的销售数据相结合,进行模型训练,帮助中石油解决长期、跨省的资源配置问题。短期预测用的技术是机器学习,中长期预测是另外一个系统。下面的内容将重点介绍短期预测的具体发展过程和技术细节。机器学习在墨迹天气应用的短期预报的开发过程和系统架构墨迹短期预报系统从2015年纠察队队长内测开始研发,逐步走向成熟。下图展示了墨迹短期预测的发展历程:在整个发展过程中,墨迹??有三个里程碑式的事件:2016年8月,首次使用深度学习CNN网络处理雷达回波中的噪声。对于单独的雷达噪声与部分混合的雷达噪声有效。2017年3月,利用人工智能技术与传统模型预报技术相结合,在雷达未覆盖地区新增GFS预报数据作为补充数据源,准确率进一步提高。2017年5月,深度学习算法应用于短期核心外推环节。下图是墨迹短期预测的顶层设计:墨迹短期预测的顶层设计由三部分组成:输入(数据源、反馈、WRF)、中间层(去噪、外推)和输出(预测图)。短期预报系统涉及的主要技术短期预报系统中使用的技术有很多。这里主要分享两部分:算法模型和算法实现。算法模型包括深度学习图像去噪算法(CNN网络)、深度学习图像外推算法(RNN循环网络)、机器学习雨雪判别模型(SVM支持向量机分类)、模型预测数据融合等。算法实现包括GoogleTensorflow深度学习框架、Caffe深度学习框架、Opencv图像处理库、Sklearn机器学习库等去噪技术去噪问题可以归结为深度学习中一类叫做“图像语义分割”的任务。与普通的图像分类任务相比,这类任务要求图像的每个点都标记其类别,相应的雷达图像去噪就是逐点标记该像素点是正常回波还是噪声。Moji通过人工采集积累了大量的噪声数据集,人工标注进行训练。目前去噪环节已经迭代了三个版本。外推技术外推技术使用RNN(递归神经网络)算法。下面是RNN(循环神经网络)的简图:预测问题是一种时间序列问题,循环神经网络非常适合处理时间序列相关的问题。下面是LSTM(长短期记忆网络)网络的简单示意图:短期预测外推需要多次循环计算过程,传统的循环神经网络会明显失去初始输入数据的特征网络在如此多的循环过程中,导致外推得到的图片准确率很低,长短期网络可以显着改善这个问题。Moji使用最近的历史图片按时间顺序进入循环网络,然后网络会根据图片的变化趋势结合历史变化生成未来预测图。雨雪判别技术如下图所示,是基于GFS预报数据的雨雪预报:下图是基于模型预报数据的雨雪分类:由于短期预报结果只能预测降水,不能区分降水的类型,需要使用一个额外的模型来判断降水的类型。雨雪判别模型的作用是通过机器学习的方法判断降水类型是雨还是雪,提供最终的实时天气类型。数值预报技术以下是全国雷达站覆盖图:以下是模型预报数据:目前墨迹也在做一些传统数值天气预报的研究和应用。从上个世纪开始,人们就采用数值天气预报的方法来解决天气预报问题。通过求解一系列描述大气运动的动力学和热力学偏微分方程的数值解,他们可以计算大气的未来状态并预测未来。天气。但是,这种预测方法的发展依赖于计算机技术的发展,因为它的计算量是相当惊人的。每个时间步长有5亿个空间网格点。考虑到空间尺度从数百米到数千公里,时间尺度从几秒到几周不等。目前,墨迹气象研究团队也在进行相关研究和应用。最小模型分辨率为3-5km,每个时间步需要计算数百万(140万)个空间网格点,计算量相当可观。令人惊讶的是,它需要使用超级计算或集群资源才能应用。展望未来,气象领域的市场竞争愈演愈烈。不知道墨迹这种基于海量气象数据分析的领先技术,能为企业级用户提供企业级气象服务能走多远,但至少墨迹是一个功能性的APP。从商业提供商向互联网综合气象服务提供商的转型,让墨迹的路越走越宽。本月热文推荐混合云Top3,如何让公有云和私有云实现1+1>2AR/VR专家告诉你:未来的人机交互场景是什么样的?如何平衡安全性和性能?电子商务网站HTTPS优化探索与实践【原创稿件,合作网站转载请注明原作者及出处.com】