Analysing E-mail Text Authorship for Forensic Purposes
分析电子邮件文本作者身份在法医领域的应用 电子邮件已经成为最受欢迎的互联网应用之一,随着其使用量的增加,通过电子邮件进行犯罪活动的情况不可避免地增多。电子邮件消息可以匿名发送,或者通过伪造的服务器发送。计算机取证分析师需要一种工具来识别这类电子邮件消息的作者。 本篇论文描述了利用来自文体学和机器学习领域的技术开发此类工具的过程。作者的风格可以通过测量文本中的各种文体学特征来简化为一种模式。电子邮件消息也包含可以从宏观上测量的结构特征。这些特征可以与支持向量机学习算法一起使用,以分类或归属电子邮件消息的作者身份,前提是提供了足够数量的消息用于比较。 在调查中,可能需要将一组作者从最初的大量嫌疑人名单中缩减。本研究尝试使用社会语言学群体,如性别和语言背景,作为对匿名消息进行人物特征分析的方法,从而缩减嫌疑人名单。 从这篇论文的研究中产生的出版物包括以下内容: 作者:Malcolm Walter Corney 被审稿的期刊文章:M. Corney, A. Anderson, G. Mohay 和 O. de Vel,"Identifying the Authors of Suspect E-mail", 提交至《计算机和安全杂志》发表,2002年。 在本论文中,研究者 Malcolm Corney 提供了他对电子邮件作者身份分析法在法医调查中应用的深入研究。这包括对文体学和机器学习技术的运用,以及如何量化分析以确定电子邮件文本的作者身份。以下几点详细阐述了作者在研究中探讨的各个关键点: 1. 电子邮件的普及及其在犯罪活动中的应用:随着电子邮件的广泛应用,犯罪分子利用其匿名性或伪造服务器发送邮件进行非法行为的趋势不断上升。这导致对能够识别电子邮件匿名发送者身份技术的需求增加。 2. 风格测量与模式识别:作者指出,可以通过测量文本中的文体学特征来归纳一个作者的风格,将其简化为一种可辨识的模式。这些特征包括词汇选择、句子结构、语法使用等方面。 3. 支持向量机(Support Vector Machine, SVM):这是一种强大的机器学习算法,用于分类和回归分析。在电子邮件作者身份分析中,SVM可以使用测量得到的文体学特征来训练模型,从而能够预测未知样本的作者身份。 4. 宏观结构特征:除了文本的微观层面特征外,电子邮件的宏观结构特征,如邮件格式、组织结构、段落使用等,也可以作为分析的一部分。 5. 社会语言学群体特征:研究者尝试使用性别、语言背景等社会语言学特征来缩小匿名电子邮件消息的作者范围,帮助将嫌疑人名单缩减至更小范围。 6. 法医取证工具的发展:本文研究的最终目标是开发一种法医取证工具,该工具能够利用上述技术和算法自动识别电子邮件的作者,从而为调查提供支持。 7. 文章中提到的出版物结果表明了该研究在学术界的影响力,具体的研究成果已经以期刊论文形式提交至《计算机和安全杂志》进行发表。 本论文所探讨的技术和方法为电子邮件作者身份分析提供了理论基础和技术框架,对于当前的计算机取证实践具有重要的参考价值,尤其在处理涉及电子邮件匿名发送的网络犯罪案件时。
- 粉丝: 0
- 资源: 1
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助