基于广义线性模型的网页信息搜索错误概率分析Error Probability Analysis of Web Information Search Based on Generalized Linear Model
黄秀常
摘要(Abstract):
传统泊松分布模型分析网页信息搜索错误概率过程中,模型构建完成后未检验模型优度,导致预测网页信息搜索错误概率的精度较低,以广义线性模型基本原理为前提,基于广义线性回归设计网页信息错误风险概率广义线性模型,采用极大似然方法估计模型回归参数α取值,通过SD方法、Pearsonχ~2方法检验模型拟合优度,分析模型变量弹性,获取影响网页信息搜索错误概率的关键因素,完成网页信息搜索错误概率分析.实验结果表明,所设计模型预测网页信息搜索错误概率精度均值高达98.5%,预测网页信息搜索错误次数与实际值吻合,能够得出影响网页信息搜索错误概率的因素.
关键词(KeyWords): 广义线性模型;信息搜索;联系函数;极大似然估计;弹性系数;错误概率
基金项目(Foundation): 2019年度义乌工商职业技术学院科研项目(2019JD304-01)
作者(Author): 黄秀常
DOI: 10.16393/j.cnki.37-1436/z.2019.02.003
参考文献(References):
- [1]刘春梅,郭岩,俞晓明,等.针对开源论坛网页的信息抽取研究[J].计算机科学与探索,2017,11(1):114-123.
- [2]徐登可,张忠占.二项-泊松模型的变量选择[J].应用数学学报,2015,38(4):708-720.
- [3]张俊玲,耿光刚,延志伟,等.基于网页信息和分词的中文机构名全称和简称提取方法[J].计算机应用研究,2017,34(4):972-976.
- [4]张伦,张悦.基于广义预测控制的混杂系统控制[J].计算机仿真,2017,34(8):138-141.
- [5]高庆宁,吴鹏,张晶晶.基于文档对象模型与行块分布算法的网页信息抽取[J].情报理论与实践,2016,39(4):133-137.
- [6]李超,郭黎利,窦峥.广义多线性混合效应模型[J].哈尔滨工程大学学报,2018,39(5):934-940.
- [7]张俊国,刘丽,李丽霞,等.惩罚广义线性模型在遗传关联研究中的应用及R软件实现术[J].中国卫生统计,2016,33(4):582-586.
- [8]Prates F,Buizza R.PRET.The Probability of RETurn:a new probabilistic product based on generalized extreme‐value theory[J].Quarterly Journal of the Royal Meteorological Society,2015,137(655):521-537.
- [9]洪东跑,王英华,管飞,等.基于广义线性模型的固体推进剂贮存寿命评估[J].北京航空航天大学学报,2015,41(1):29-32.
- [10]刘鸿优,彭召方.足球技战术表现大数据分析——基于广义线性模型与数据级数推断法[J].体育学刊,2017,24(2):109-114.
- [11]孙维伟,张连增,胡祥.基于分层广义线性模型的非寿险费率厘定精算模型研究[J].统计与信息论坛,2017,32(6):48-54.
- [12]胡熠,刘云峰,段建勇,等.网页搜索中查询时效性的实时计算模型[J].中文信息学报,2016,30(1):79-85.
- [13]孟生旺,邱子真.混合效应模型及其在非寿险费率厘定中的应用[J].数理统计与管理,2016,35(1):154-161.
- [14]He Z,Zhang D,Renton A E,et al.The Rare-Variant Generalized Disequilibrium Test for Association Analysis of Nuclear and Extended Pedigrees with Application to Alzheimer Disease WGS Data[J].American Journal of Human Genetics,2017,100(2):193-204.
- [15]王晓艳,林昌意.基于查询意图的中文信息类网页分类研究[J].图书情报工作,2015,59(1):113-118.