【转载】推荐算法集锦(上)——协同过滤算法 协同过滤(CF,Collaborative Filtering)的主要思想就是利用与当前用户具有相同兴趣或者历史行为的其他用户群,通过分析这些用户群目前的喜好或者行为信息来预测当前用户可能喜欢的东西或者可能产生的行为,说白了就是一句短语:“物以类聚,人以群分”。 小麦 2020年12月17日 协同过滤
【转载】什么是判别分析?如何应用? 判别分析最初应用于考古学, 如要根据挖掘出来的人头盖骨的各种指标来判别其性别年龄等.。慢慢的成为一种常用的分类分析方法,其通过已知的分类情况,根据数据的特征对其他研究对象进行预测归类。 小麦 2020年12月17日 判别分析
【转载】python数据分析:分类分析(classification analysis) 分类的主要用途和场景是“预测”,基于已有的样本预测新样本的所属类别。例如信用评级、风险等级、欺诈预测等;同时,它也是模式识别的重要组成部分,广泛应用到机器翻译,人脸识别、医学诊断、手写字符识别、指纹识别的图像识别、语音识别、视频识别的领域;另外,分类算法也可以用于知识抽取,通过模型找到潜在的规律,帮助业务得到可执行的规则。 小麦 2020年12月17日 分类分析
活见久!EXCEL终于活成了你想要的样子,性能已提升10倍 Excel在处理大数据量时捉襟见肘的表现,曾经让很多用户抓狂,EXCEL性能弱已经是一个不争的事实。众所周知,EXCEL的处理上限是100万行,如果超过了100万行,EXCEL便束手无策了,即使数据量只有几万行,EXCEL也会变得非常卡,对于习惯使用EXCEL的用户来说,这无疑是一个非常头疼的事情。 小麦 2020年12月17日 EXCEL 大数据
【转载】数据挖掘之聚类分析 聚类分析是在没有给定划分类别的情况下,根据数据相似度进行样本分组的一种方法。与分类模型需要使用有类标记样本构成的训练数据不同,聚类模型可以建立在无类标记的数据上,是一种非监督的学习算法。 小麦 2020年12月17日 聚类分析
【转载】用于数据分析任务的常用 SQL 函数 与21世纪数据相关的一切和一切已成为主要相关性。任何数据科学研究者的关键技能之一是掌握 SQL 函数,以便进行高效的数据检索。SQL 被广泛用于直接从数据库进行查询,因此是数据分析任务最常用的语言之一。但它有其自身的复杂性和细微差别。 小麦 2020年11月27日 SQL
【转载】15岁云计算的一刻钟自白 这篇文章主要面向大中型企业的技术和非技术管理者。我通过描绘云计算技术和市场领域的发展过程,介绍关键技术和市场里程碑,包括不同技术域下的核心开源项目,让企业能够对云计算发展历史和相关技术域有一个通盘的了解。 小麦 2020年11月27日 云计算 大数据
【转载】为什么你的直播带货赔钱了?大数据会拯救你 一边是主播频发战报、品牌方狂秀战绩,另一边是直播带货造假、刷量、欺诈新闻不断,从年初持续到年尾,也让越来越多的商家陷入不安;特别是在双11之后,这种两面性愈发凸显,这可愁坏了众多老板们,直播带货难道最后只是带了个寂寞?主播们也不讲武德了? 小麦 2020年11月27日 大数据 明星直播
【转载】浅谈数据湖 维基百科上定义,数据湖(Data Lake)是一个以原始格式存储数据的存储库或系统。它按原样存储数据,而无需事先对数据进行结构化处理。一个数据湖可以存储结构化数据(如关系型数据库中的表),半结构化数据(如CSV、日志、XML、JSON),非结构化数据(如电子邮件、文档、PDF)和二进制数据(如图形、音频、视频)。 小麦 2020年11月27日 数据湖
敢与大数据掰手腕,了解一下EXCEL的四宗“最” 但是,你还千万别小瞧了EXCEL,虽然EXCEL有一定功能上的缺陷,但是麻雀虽小五脏俱全,应用非常广泛,是一款不可或缺的办公软件。那么究竟EXCEL能不能处理大数据呢?我们通过四宗“最”去了解一下。 小麦 2020年11月26日 EXCEL