机器学习datathon covid-19标志

SBMI Datathon 2021中风的预测

报名截止日期:3月25日th,2021年


比赛日期:3月27日th- 28th,2021年


协办单位:
扎姆斯Yejin Kim江全新课题,肖恩·萨维茨

关于Datathon


2017年,在美国的780万名成年人报告中风幸存下来。中风而死亡人数有所下降,中风发病率和残疾的主要原因。到2030年,中风相关的成本预计将达到1830亿美元。尽管早期治疗,中风幸存者往往有严重的长期残疾包括身体和认知问题,需要不断的监测和护理社区。康复是必不可少的在受伤后很快恢复,开始当大脑尤其接受过程,可以提高修复。适当的数量、质量和时间的康复治疗是未知的优化结果和有效解决障碍。精确的预测功能和认知结果中风急性期是很重要的一个个性化的康复计划,改善病人之间的交流,家庭,和临床医生对可能的结果和期望。


主题


Datathon的主题是让参与者竞争发展的算法来预测认知的变化和功能独立性测量(鳍)分数(18子类)在住院康复(区别承认FIM得分为每个子类和放电)。鱼翅分数是广泛使用在北美测量残疾。它包括十八子分类的评估项目,分为六个部分。鱼翅评估运动和认知功能,越来越鱼翅分数意味着功能改进而降低分数意味着减少患者的功能状态。

FIM得分为每个类别的范围从1到7的地方:

7 6 5 4 3 2 1
完全独立 修改后的独立 监督 最小的帮助 温和的援助 最大的帮助 总援助可测试的

客观的

参与者预计开发算法共同预测FIM得分在住院期间的变化在每个子类从入院到出院康复。

预测变量

预测变量包括连续和分类变量。投入了大量的精力在组织和清洁数据集,参与者预计能够使用新策略来处理缺失值的预测变量。


评价


在这个机器学习的挑战,我们要求参与者建立模型(以正当的方式)和评估最终的性能,基于L1(曼哈顿)的距离距离L1的例子代表的实际和预测变化鱼翅分数(即。,子目录页)。如果有关系的表现,更多的会考虑模型的可解释性和识别预测变量的重要性,应该参与者的表现挂钩。

最终输出的例子:

ID Eating-Change Bathing-Change 记忆变化
One hundred. 5 7 1 3 2
101年 2 7 3 2 5
102年 4 3 1 1 2

数据描述

训练数据是在一个CSV文件(train.csv)以以下格式:

火车的形象。CSV文件

标签包含18个鱼翅子类,学员要预测一个向量(18)的向量中的每个值代表承认FIM评分的差异为每个子类和放电。


竞争规则


  • 参与者被要求提交源代码(例如,Jupyter笔记本)在一个独立的方式。
  • 从服务器下载数据并保存这些数据在本地使用后竞争是严格禁止的。
  • 私下里共享数据在我们提供的环境在比赛中是不允许的。
  • 参赛者必须使用一个算法的预测方法。对方法的任何更改必须在一个自动化的方式,这样的方法可以推广到新的主题。
  • 使用外部数据是允许的。
  • 所有的参与者被要求准备总结幻灯片将描述他们的模型。
  • 排名前三的参与者将被要求给一个简短的发言,排行榜上的排名前十的参与者可能有机会发表他们的研究成果在杂志的特刊(谈判)。
  • 参与者可以提交最多10个条目。最佳性能的条目最终判决的目的。



由UTHealth总计1500美元

  • 首先:1000美元
  • 第二名:300美元
  • 第三名:200美元


常见问题


常见问题

在读本科生和研究生第一/第二年的硕士项目或在第一个两年的博士学位项目从机构在墨西哥湾沿岸的财团(含UTHealth MDACC,呃,大米,TAMU, UTMB, IBT,贝勒,等等)。此外,从休斯顿地区符合条件的学生(如HBU, SHSU,台联,PVAMU,圣托马斯大学UH-Clear湖,UH-Sugar土地,和UH-Victoria等等)被鼓励申请。
不,这种竞争是免费的。
不,由于COVID-19大流行,竞争将远程举行。我们的团队将为您提供所需的VPN和访问的编码环境。
这是一个编码datathon。你要掌握机器学习的基本编程技能和知识。
我们的专家小组由UTHealth生物医学信息学学院的教员。您的项目将通过一个自动判断排行榜程序;每个参赛者只能提交的10倍。排名前三的选手将被要求做一个简短的介绍他们的解决方案的活动。


Baidu