北京湿疹中医医院 http://m.39.net/pf/a_8839619.html全文共字,预计学习时长4分钟
拥有一家数据科学咨询公司的A先生,最近遇上了一件棘手的事情。
他需要招聘2名数据科学家去完成一个优质项目,于是他将招聘信息放在了LinkdIn上。出乎意料的是,他竟然收到了近份求职简历。
在项目急需马上开展的当下,他有些焦急,“如果有一种方法能让我不必挨个浏览,还能快速地挑出最合适的简历就好了!”
其实,这个问题可以用自然语言处理(NLP)技术来解决,起码可以缩短简历浏览的时间。
需求
首先,我们来看看具体的招聘要求:
·一位有深度学习的核心技能,并对其他机器学习算法也有所了解的人。
·一位具备大数据或数据工程技能,如Scala、AWS、Dockers、Kubernetes等的人。
方法
了解了具体的招聘要求后,我们可以设计出一个解决此问题的方法:
·建立一个包含所有技能分类的词典或表格,如将词语“keras,tensorflow,CNN,RNN”放入“深度学习”的列中。
·通过自然语言处理算法对简历进行分析,并搜寻上述词典或表格中提及的关键词。
·然后计算每个类别的关键词出现的次数。如下图所示:
该表所示的求职者与A想要的“掌握深度学习的数据科学家”很符合。
·将以上信息以可视化的方式展现出来,以便对求职者进行筛选。
研究
方法已经大致确定了,下一个难题是如何实现。
自然语言处理部分——Spacy
Spacy有一个功能叫做“短语匹配器”(