英语翻译This question will introduce you to a method for comparing documentsbased on ideas in linear algebra.Suppose you are given a set of n documents numbered 1 through n.Suppose there isa list of m words numbered 1 through m that are of intere
来源:学生作业帮助网 编辑:六六作业网 时间:2024/12/22 20:26:25
英语翻译This question will introduce you to a method for comparing documentsbased on ideas in linear algebra.Suppose you are given a set of n documents numbered 1 through n.Suppose there isa list of m words numbered 1 through m that are of intere
英语翻译
This question will introduce you to a method for comparing documents
based on ideas in linear algebra.
Suppose you are given a set of n documents numbered 1 through n.Suppose there is
a list of m words numbered 1 through m that are of interest to you.De\x0cne vectors x1
through xn as follows:the jth entry of xi is the number of times the jth word appears
in the ith document.You can think of xi as a summary of the information in the ith
document.
I selected three articles from Wikipedia and counted the number of times the words
fur,blood,bone,feather appeared in each.Here are the results:
Article fur blood bone feather
Mammal 6 4 15 0
Reptile 1 5 0 3
Bird 0 7 5 43
You are encouraged to use a calculator or a computer for the following questions.
a.Write down the vectors x1,x2,x3,for the words given.
b.We de\x0cne the similarity of documents i and j as
xi \1 xj
kxik kxjk
Compute the similarity between documents 1 and 2,between documents 2 and 3,
and documents 1 and 3.According to this measure is document 2 more similar to
document 1 or to document
c.Is it possible to have negative similarity between two documents?Why or why not?
英语翻译This question will introduce you to a method for comparing documentsbased on ideas in linear algebra.Suppose you are given a set of n documents numbered 1 through n.Suppose there isa list of m words numbered 1 through m that are of intere
这道题目会教你一种用线性代数的知识比较数据的方法.
假设现有一组从1到n的数据和一组对照数据从1标记至m.定义如下向量从x1至xn:第j个xi的数据次数是第j个词在第i个文档的位置.可以把xi数据表当作是以i为标记的文档摘要.
我从维基百科中选择了3篇文章并计算了词组:皮毛,血液,骨头,羽毛在这些文章中分别出现了多少次.以下是我的计算结果:
文章名 皮毛 血液 骨头 羽毛
哺乳动物 6 4 15 0
爬行动物 1 5 0 3
鸟类 0 7 5 43
你可以使用计算器或者电脑来帮助解决以下问题.
a.写下与给出的词组对应的向量 x1,x2,x3
b.我们把数据i 和数据j 的相似处定义为
xi \1 xj
kxik kxjk
计算出数据1 和数据2,数据2和数据3,以及数据1和数据3之间的相似结果.根据你得出的结果,2号数据组与1号数据组更相似还是与3号数据组更相似呢?
c.两组数据间有可能出现负数值的相似结果吗?如有可能,请简要回答;如果没可能,请解释原因.
这个问题会介绍给你的方法来比较文件
基于理念在线性代数。
假设你给出一组n文件数1至vi . vt。假设有
我民的一张表1至米的话,您的兴趣。x1 Dene向量
通过jth如下:中国进入的次数烯的jth词出现
在与文件。你能想到的喜摘要制作中的信息
文件。
我选择三篇文章,并计算了维基的次数的词语
皮毛、血液、骨格、羽毛出现在每件。这...
全部展开
这个问题会介绍给你的方法来比较文件
基于理念在线性代数。
假设你给出一组n文件数1至vi . vt。假设有
我民的一张表1至米的话,您的兴趣。x1 Dene向量
通过jth如下:中国进入的次数烯的jth词出现
在与文件。你能想到的喜摘要制作中的信息
文件。
我选择三篇文章,并计算了维基的次数的词语
皮毛、血液、骨格、羽毛出现在每件。这里是结果:
第三皮毛血骨的羽毛
哺乳动物6 4 15 0
爬行动物1五0 3
鸟0 7 5 43
鼓励使用计算器或一个计算机为下面的问题。
。写下向量,x1冷却,那句话,三分,给你们。
b。我们dene文书的相似性和j
喜xj
kxik kxjk
计算之间的相似文件1和2 2号和3号文件之间,
1号和3号文件。根据这一措施更类似于2文件
文件1或记录3 ?
c。是否有可能有负面之间的相似两份文件吗?为什么能或为什么不能?
收起
This question will introduce you to a method for comparing documents based on ideas in linear algebra.
下面这个问题将介绍如何用线性代数的方法来比较文档。
Suppose you are given a set of n documents numbered 1 through n...
全部展开
This question will introduce you to a method for comparing documents based on ideas in linear algebra.
下面这个问题将介绍如何用线性代数的方法来比较文档。
Suppose you are given a set of n documents numbered 1 through n. Suppose there is a list of m words numbered 1 through m that are of interest to you.
假设现有一组文档资料共n个文件,编号为1,2,...n; 同时你所关心的一些单词指标有m个,编号为1,2,...m.
De ne vectors x1 through xn as follows:
向量 x1 , ... xn 定义如下:
(译者注:这里定义的是作为向量的x1,作为向量的x2.....而不是向量 [x1,...xn], 因而下文的定义实际上是定义了对于向量xi的各分量xi1,xi2...xij,...xim的意义。)
the jth entry of xi is the number of times the jth word appears in the ith document.
xi的第j项表示:在序号为i的文档中,编号为j的单词出现的次数。
You can think of xi as a summary of the information in the ith document.
事实上可以认为xi 是包含第i号文档中的所有信息。
I selected three articles from Wikipedia and counted the number of times the words fur, blood, bone, feather appeared in each.
例如:从Wikipedia中选取三个词条,考察每篇词条中如下关键词汇出现的情况:[fur](皮毛), [blood](血液), [bone](骨骼), [feather](羽毛)。
Here are the results:
结果如下:
词 条 标 题 fur blood bone feather
Mammal(哺乳动物) 6 4 15 0
Reptile(爬行动物) 1 5 0 3
Bird(鸟类) 0 7 5 43
You are encouraged to use a calculator or a computer for the following questions.
解决以下问题(可用计算器或计算机完成):
a. Write down the vectors x1, x2, x3, for the words given.
a. 根据所给信息,写出向量x1, x2, x3。
b. We dene the similarity of documents i and j as
b.按照如下方式给出判定两文档i与j之间的[similarity](暂译为相似度)准则:
(译者注:此处应为求行列式值,为明了将下标加以括号区分,矩阵第二行的x前面的k为系数。)
x(i) \1 x(j)
k*x(ik) k*x(jk)
Compute the similarity between documents 1 and 2, between documents 2 and 3, and documents 1 and 3. According to this measure is document 2 more similar to document 1 or to document 3?
计算文件1与文件2之间、文件2与文件3之间、以及文件1与文件3之间,各相似度[similarity]是多少。根据这种判断方式,文件2与哪个文件相似度更高?1还是3?
c. Is it possible to have negative similarity between two documents? Why or why not?
两文件之间的相似度有可能为负数吗?为什么?
收起
这个问题会介绍给你的方法来比较文件
基于理念在线性代数。
假设你给出一组n文件数1至vi . vt。假设有
我民的一张表1至米的话,您的兴趣。x1 Dene向量
通过jth如下:中国进入的次数烯的jth词出现
在与文件。你能想到的喜摘要制作中的信息
文件。
我选择三篇文章,并计算了维基的次数的词语
皮毛、血液、骨格、羽毛出现在每件。这...
全部展开
这个问题会介绍给你的方法来比较文件
基于理念在线性代数。
假设你给出一组n文件数1至vi . vt。假设有
我民的一张表1至米的话,您的兴趣。x1 Dene向量
通过jth如下:中国进入的次数烯的jth词出现
在与文件。你能想到的喜摘要制作中的信息
文件。
我选择三篇文章,并计算了维基的次数的词语
皮毛、血液、骨格、羽毛出现在每件。这里是结果:
第三皮毛血骨的羽毛
哺乳动物6 4 15 0
爬行动物1五0 3
鸟0 7 5 43
鼓励使用计算器或一个计算机为下面的问题。
。写下向量,1冷却,那句话,三分,给你们。
b。我们dene文书的相似性和j
喜xj
kxik kxjk
计算之间的相似文件1和2 2号和3号文件之间,
1号和3号文件。根据这一措施更类似于2文件
文件1或记录3 ?
c.是否有可能有负面之间的相似两份文件吗?为什么能或为什么不能?
收起