Data Mining & Market Analysis · Complete Report · June 2026

亚马逊印度电商
商品市场分析

基于 Amazon India 1,465 条真实产品数据,融合 EDA、K-Means 聚类与随机森林回归的全流程数据挖掘报告

← 返回项目详情

数据概览与品类结构

1,465 条 Amazon India 产品数据的基础分布——品类格局、评分形态、折扣特征。

各类别商品数量分布 (Top 5)
品类分布
商品评分分布
评分分布
折扣率分布
折扣分布
各类别商品价格区间分布
价格区间

价格与折扣分析

价格分布、折扣策略与品类间的定价差异。

原价 vs 折后价(对数轴)
价格散点
各类别平均折扣率
平均折扣

评分与用户反馈

折扣率与评分的关系——"高折扣=高评分"的假设是否成立?

评分 vs 折扣率(含趋势线)
评分vs折扣
各类别评分箱线图
评分箱线图

相关性分析

数值变量之间的真实统计关系。

数值变量相关系数矩阵
相关性

K-Means 聚类 — 产品自动分群

以折后价与折扣率为特征,Elbow Method 确定 K=3,将产品分为三类运营群。

Elbow Method — 最优 K 值选择
Elbow
K-Means 聚类散点图 (K=3)
聚类

随机森林回归 — 评分预测与因素归因

以 5 个可观测特征预测评分,量化各因素贡献度。测试集 R² = 0.082。

随机森林特征重要性
特征重要性
预测值 vs 真实值
预测vs真实

AI 洞察与运营建议

1

折扣不是万能药。r = −0.16, R² = 0.082,双重验证:折扣深度与评分无关。运营重心从"打价格战"转向"提升产品力"。

2

产品分三类运营。K-Means 揭示的低价冲量型、中价低折型、高价保利型——需差异化定价、促销与库存策略。

3

Home & Kitchen 是安全赛道。评分方差最小,新品首发优选。避开 Cables & Accessories 的 480 SKU 红海。

4

价格仅解释 8% 的评分。与其在折扣上内卷,不如投资产品品质和品牌建设——这才是真正的护城河。

5

中等折扣(30%–60%)是定价甜蜜点。建议新品定价折扣设为 45%–55%,测试转化率后微调。