关于“极大似然估计值”和“大数定理”W=w1 w2……wm是字串S=c1 c2……cn的一种切分结果.wi 是一个词,P(wi)表示wi的出现的概率.在大规模语料库训练的基础上,根据大数定理[8],即:在大样本统计

来源:学生作业帮助网 编辑:六六作业网 时间:2024/12/24 02:14:49
关于“极大似然估计值”和“大数定理”W=w1w2……wm是字串S=c1c2……cn的一种切分结果.wi是一个词,P(wi)表示wi的出现的概率.在大规模语料库训练的基础上,根据大数定理[8],即:在大

关于“极大似然估计值”和“大数定理”W=w1 w2……wm是字串S=c1 c2……cn的一种切分结果.wi 是一个词,P(wi)表示wi的出现的概率.在大规模语料库训练的基础上,根据大数定理[8],即:在大样本统计
关于“极大似然估计值”和“大数定理”
W=w1 w2……wm是字串S=c1 c2……cn的一种切分结果.wi 是一个词,P(wi)表示wi的出现的概率.在大规模语料库训练的基础上,根据大数定理[8],即:在大样本统计的前提下,样本的频率接近于其概率值.所以P(wi)的极大似然估计值[9]等于词频,有:
P(wi) ≈ki /(k1+k2+k3+...+km)
(其中ki为wi在训练样本中出现的次数)…………………………②
-------------------------------------------------
谁能给我讲讲这里的“大数定理”和“极大似然估计值”
特别是“极大似然估计值”

关于“极大似然估计值”和“大数定理”W=w1 w2……wm是字串S=c1 c2……cn的一种切分结果.wi 是一个词,P(wi)表示wi的出现的概率.在大规模语料库训练的基础上,根据大数定理[8],即:在大样本统计
大数定律有3个,指的是样本很大时的趋势,只具有统计学意义.常用的是伯努力大数定律,也就是你说的那个.数学书中总是给明了一件事发生的确切概率,但实际中我们并不能知道它,比如你怎么知道硬币正面的概率就是0.5呢?所以我们能做的就是随机试验,观察每次试验的结果并纪录,统计某个结果发生的频率.严格的说,频率并不是概率,但大数定律在这里就发挥作用了,数学家们严格的证明了:当你的试验次数足够大时,频率的极限就是概率!所以大数定律是数理统计的理论基础,统计学的其他结论都是基于此得出的.
至于极大似然估计,只是一种概率论在统计学的应用,它是参数估计的方法之一.说的是已知某个随机样本满足某种概率分布,但是其中具体的参数不清楚,参数估计就是通过若干次试验,观察其结果,利用结果推出参数的大概值.极大似然估计是建立在这样的思想上:已知某个参数能使这个样本出现的概率最大,我们当然不会再去选择其他小概率的样本,所以干脆就把这个参数作为估计的真实值.
当然极大似然估计只是一种粗略的数学期望,要知道它的误差大小还要做区间估计.
打了这么多字累死我了…………其实你可以看看数理统计的教科书,那里面有更详细的分析.

参考高等数学下册.

看书比在网上码字讲的清楚

关于“极大似然估计值”和“大数定理”W=w1 w2……wm是字串S=c1 c2……cn的一种切分结果.wi 是一个词,P(wi)表示wi的出现的概率.在大规模语料库训练的基础上,根据大数定理[8],即:在大样本统计 关于“极大似然估计值”和“大数定理”W=w1 w2……wm是字串S=c1 c2……cn的一种切分结果.wi 是一个词,P(wi)表示wi的出现的概率.在大规模语料库训练的基础上,根据大数定理[8],即:在大样本统计 求矩估计值和极大似然估计值.概率论 谢谢 设总体X 的概率分布为,求矩估计值和最大似然估计值. 设X服从0-1分布,X1,X2.XN是来自X的一个样本,试求参数P的极大似然估计值 设总体X的概率分布为,求θ的矩估计值和最大似然估计值求问最大似然函数如何构造出来?x平均=2最大似然函数为 一个概率论与数理统计的问题.如图:6.1和6.3,都是求矩估计值和最大似然估计值.急求哦.帮帮忙哦.详细点哦.万分感谢! 概率统计,大数定理 如何理解大数定理不能理解大数定理无视原来分布的原理和实际应用的意义 概率论极大似然估计值到底表示什么如图,求出λ之后,答案直接就用λ表示电视机的估计的平均寿命,可是电视机的平均寿命不是应该是期望,即1/λ吗? 概率与数理统计 关于矩估计和极大似然估计的一道题,谁能给我写下答案.. 极大似然估计的概念,原理和方法 概率论矩估计和极大似然估计 大数定理有什么用的大数定理什么用 最大似然估计值和最大似然估计量的区别是什么?请问一下《概率论和数理统计》的参数估计那一章里,最大似然估计值和最大似然估计量有什么区别? 大数定理运用什么思想 概率论 大数定理 中心极限定理 应用概率求最大似然估计值过程(急)