社交媒体平台中的白话差异：使用NLP模型BERT和LSTM来检测不同社交媒体平台上对话中的白话差异

共28个文件

ipynb：7个

json：6个

tsv：2个

JupyterNotebook

需积分: 44 5 下载量 98 浏览量 2021-02-13 19:09:57 上传评论收藏 4.03MB ZIP 举报

温馨提示

信用该存储库由ThilinaRajapakse派生而来，后者使用了HuggingFace PyTorch-Transformers库来使用UC Berkeley的信息与数据科学硕士计划。特别是，该存储库将用于展示JJ Sahabu和George Tao在其W266 Final Project中的工作。目的该项目具有二进制文本分类功能，用于区分Twitter和Facebook数据。该项目的目的是展示RoBERTa的简单用法，并将其与LSTM进行比较，并提供朴素的基线模型，以充分了解最新的自然语言处理模型的改进。为了进行二进制文本分类，我们使用预处理的社交媒体文本数据微调了多个模型。以下部分由ThilinaRajapakse撰写高温高压变压器分类该存储库基于库。它是任何希望在文本分类任务中使用Transformer模型的人的起点。请参阅此以获取有关该项目如何工作的更多信

资源推荐

资源详情

资源评论