Select Language

AI社区

数据要素产业

机器学习算法量化天文学领域性别歧视

一项利用机器学习对性别歧视进行量化的研究发现,天文学领域的引用率对女性不利。据苏黎世瑞士联邦理工学院的研究人员估计,由于性别歧视,和男性相比,第一作者为女性的论文引用率要低10%左右。

引用模式上的性别差异此前在科学界有据可查。不过,研究人员之前并未试图对有多少差异是性别歧视导致的结果进行量化。比如,男性和女性可能发表不同类型的论文;女性可能在不同的科学领域工作,并且拥有资历较浅的职位。

这篇尚未接受同行评议但已在预印本服务器arXiv上发表的最新文章,试图解释并修正这些因素。文章作者拒绝就论文发表评论,因为他们希望将其提交给《自然—天文学》杂志发表。不过,其他专家表示,分析看上去很可靠。

“这篇文章的新颖之处在于,打破了认为引用上的性别差异可能归因于论文的具体内容而非性别的神话。”美国印地安那大学伯明顿分校信息学家Cassidy Sugimoto表示。

研究人员分析了1950~2015年发表在5本期刊上的20万篇论文。首先,他们训练机器学习算法精确地计算出每篇第一作者为男性的论文的引用率。这个过程利用了尽可能多的和性别无关的因素,比如论文发表的期刊、领域和年份,第一作者所处的位置以及发表论文已有多少年。

随后,他们让算法分析第一作者为女性的论文。和第一作者为男性的论文相比,这部分文章(自1985年起)的实际引用率低6%左右。不过,该算法预测,这些论文本应再获得4%的引用率。

研究人员表示,这是他们在“衡量性别歧视方面所做的最好努力”,但他们的结果应当被谨慎对待,因为该算法可能还需要将其他因素考虑进来。(徐徐)