词袋模型是什么意思
来源:学生作业帮助网 编辑:六六作业网 时间:2024/11/24 00:59:35
词袋模型是什么意思词袋模型是什么意思词袋模型是什么意思Bagofwords,也叫做“词袋”,在信息检索中,Bagofwordsmodel假定对于一个文本,忽略其词序和语法,句法,将其仅仅看做是一个词集
词袋模型是什么意思
词袋模型是什么意思
词袋模型是什么意思
Bag of words,也叫做“词袋”,在信息检索中,Bag of words model假定对于一个文本,忽略其词序和语法,句法,将其仅仅看做是一个词集合,或者说是词的一个组合,文本中每个词的出现都是独立的,不依赖于其他词是否出现,或者说当这篇文章的作者在任意一个位置选择一个词汇都不受前面句子的影响而独立选择的.
这种假设虽然对自然语言进行了简化,便于模型化,但是其假定在有些情况下是不合理的,例如在新闻个性化推荐中,采用Bag of words的模型就会出现问题.例如用户甲对“南京醉酒驾车事故”这个短语很感兴趣,采用bag of words忽略了顺序和句法,则认为用户甲对“南京”、“醉酒”、“驾车”和“事故”感兴趣,因此可能推荐出和“南京”,“公交车”,“事故”相关的新闻,这显然是不合理的.