Apriori算法的Python实例演示

2023 年 11 月 05 日

161 次浏览

2153字数

Apriori算法是一种在数据集中寻找频繁项集的有效方法。它是基于一个有趣的原理，被称为Apriori原理：如果一个项集是频繁的，那么它所有的子集也是频繁的。为了理解这个过程，想象其中一个疯狂的购物者，他每次都买三样东西：鸡蛋，牛奶，和黄油。那么，任何由这三样东西组成的小购物集，如牛奶和黄油，牛奶和鸡蛋等，都可以被认为是频繁的。

我们一步步从Python代码中战胜这个名为频繁项集挖掘的巨人。为了使事情变得有趣，我们将数据集设想为一个超市货架的挑战，货架上放着各种各样的商品，我们的目标是找出那些经常一起被购买的商品。

首先，伸开你的拳头，准备写代码，首先需要引入必要的Python库。

import numpy as np
import pandas as pd
from mlxtend.preprocessing import TransactionEncoder
from mlxtend.frequent_patterns import apriori

Python有一些可用的库已经简化了Apriori算法的实现，在这个例子中，我们将使用mlxtend库。

第一步是定义我们的数据集。让我们假设有一个小规模的超市，有以下几个交易：

data = [['牛奶', '鸡蛋', '黄油'],
        ['面包', '牛奶', '鸡蛋', '苹果'],
        ['面包', '牛奶', '黄油', '啤酒'],
        ['面包', '啤酒', '鸡蛋'],
        ['面包', '牛奶', '啤酒', '黄油'],
        ['牛奶', '鸡蛋'],
        ['牛奶', '啤酒', '黄油'],
        ['面包', '黄油']]

然后，我们需要对数据进行预处理，将其转换为适合进行Apriori算法的格式，我们可以使用TransactionEncoder进行以下操作：

te = TransactionEncoder()
te_data = te.fit(data).transform(data)
df = pd.DataFrame(te_data, columns=te.columns_)

形象地说，我们刚刚做的处理就像给超市每一种商品的购买情况进行了一个“盘点”, 商品是否出现在某一交易中，我们记录为True，否则为False。

现在，轮到Apriori算法发挥作用了。定义一个最小支持度，并使用以上处理后的数据，我们可以调用apriori方法：

frequent_itemsets = apriori(df, min_support=0.1, use_colnames=True)
frequent_itemsets

经过运行，你会看到一些集合出现，每个集合的支持度也会给出。这些集合就是你想要的，经常一起被购买的商品组合。不要忘记，min_support参数将决定频繁项集的数量和大小，你可以根据自己的需要进行更改。

这个过程就如同打开一个神秘的宝箱，获得潜藏在数据中的知识。你愿意启动这次寻找宝藏的冒险了吗？别让你的代码在闲置中生锈，开始你的探索吧！

云服务器推荐

蓝易云国内/海外高防云服务器推荐

蓝易云-五网CN2服务器【点我购买】

蓝易云采用KVM高性能架构，稳定可靠，安全无忧！
蓝易云服务器真实CN2回国线路，不伪造，只做高质量海外服务器。

海外免备案云服务器链接：www.tsyvps.com

持有增值电信营业许可证：B1-20222080【资质齐全】

蓝易云香港五网CN2 GIA/GT精品网络服务器。拒绝绕路，拒绝不稳定。

百度搜索：蓝易云

Apriori算法的Python实例演示

小蓝 • 2023 年 11 月 05 日

Apriori算法的Python实例演示

云服务器推荐

蓝易云国内/海外高防云服务器推荐

百度搜索：蓝易云

发表评论取消回复
使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

微信视频号视频下载工具WeChatVideoDownloader

【电脑软件】Google翻译修复工具

Windows微软常用运行库合集一键安装

Win11系统优化工具-Windows11一键设置

一键防撤回、支持多开微信（QQ、TIM、QQ轻聊版、微信）快捷小工具

基于go版本的LoraWAN Server的470MHz频段的设置

如何在阿里云服务器上进行免备案操作 - 蓝易云

高防CDN:网络攻防的坚强防线

docker镜像配置mysql、redis

如何解决系统报错：nf_conntrack: table full, dropping packets

Apriori算法的Python实例演示

蓝易云国内/海外高防云服务器推荐

百度搜索：蓝易云

发表评论 取消回复 使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

Apriori算法的Python实例演示

发表评论取消回复
使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款