## **背景描述**
糖尿病是一种影响全球数百万人的慢性疾病,对公共健康构成重大威胁。准确预测糖尿病的发病风险对于早期干预和预防至关重要。通过机器学习模型分析影响糖尿病的主要因素,可以帮助医疗从业者更好地了解病因和风险因素,从而制定有效的预防和治疗策略。
本数据集来自Kaggle,包含了患者的各项健康指标及其是否患有糖尿病的标签。数据集的主要目标是通过机器学习模型预测糖尿病的发病风险,并分析影响糖尿病的主要健康因素。
## **数据
说明**
| 字段名 |
说明 |
| --- | --- |
| PatientID | 患者ID |
| Age | 年龄(岁) |
| Gender | 性别,0:男,1:女 |
| Ethnicity | 种族,0:白种人,1:非裔美国人,2:亚洲人,3:其他|
| Socioeco
nomicStatus | 社会经济地位,0:低,1:中,2:高 |
| Educatio
nLevel | 教育水平,0:无,1:高中,2:学士学位,3:更高 |
| BMI | 体质指数(体重(kg)/身高(m)^2) |