|
|
1.1.1、黄聪:搜索引擎的工作原理-基础要求
( w/ H, u& ]6 y5 b1.1.2、黄聪:搜索引擎工作原理-网页搜索基础简介
- f, Q. U, V) {! ]3 F% T4 S; b3 G; T1.1.3、黄聪:搜索引擎工作原理-预处理基础简介. g, c) w$ q/ x+ d6 ]( r
1.1.4、黄聪:搜索引擎工作原理-查询服务基础简介/ g' i a1 r! N F
1.1.5、黄聪:搜索引擎工作原理-体系结构. q x* D$ x6 H! n" q/ H- }
2.1、黄聪:页面搜集原理、技术和系统-基础知识/ A! F! I6 }5 S; y& X4 a) V( D
2.2、黄聪:页面搜集原理、技术和系统-搜集过程6 U2 s5 p$ c: f3 b2 i; t# {
2.3、黄聪:页面搜集原理、技术和系统-天网存储结构定义
" [* X3 T. Q' l7 i4 Q9 ?3 s5 J2.4、黄聪:页面搜集原理、技术和系统-如何避免网页重复搜集
2 P3 z) I5 w. ], w2.5、黄聪:页面搜集原理、技术和系统-如何首先搜集重要的网页' u1 b9 `: z2 J" K; H
2.6、黄聪:页面搜集原理、技术和系统-可扩展搜索子系统
* J5 P" {' K5 ?# `0 G: i' }* B. y) h2.6.1、黄聪:可扩展搜索子系统-节点间URL的划分策略
2 y7 Q) R1 |6 P" Q& A' F3 j2.6.2、黄聪:可扩展搜索子系统-系统的动态可配置性设计3 o+ T: G. Q# t1 O7 G
3.1、黄聪:搜集信息的预处理-系统结构
3 z' ?! E2 D" ?/ d `3.1.1、黄聪:搜集信息的预处理-索引网页库
* b: I1 E. N# W, K4 s" d. T3.1.2、黄聪:搜集信息的预处理-中文分词技术
# V: L4 D' l) @! Z/ p3.1.3、黄聪:搜集信息的预处理-分析页面和建立倒排文件
7 Z0 J# b0 ]& ^5 B. ^- P- s$ C: ]- m3.2、黄聪:搜集信息的预处理-网页净化和消重. i% B. i0 R4 i! T; v
3.2.1、黄聪:搜集信息的预处理-净化与数据提取
8 ?# y+ |) a& N% s9 a" @3.2.2、黄聪:搜集信息的预处理-网页消重3 `1 o5 y1 V3 F) |
4.1、黄聪:搜集引擎信息查询服务-网页信息检索
9 l7 a% |+ W6 ~2 ~; ~6 F& E( z4.2、黄聪:搜集引擎信息查询服务-中文自动摘要
$ a: z) x5 _- x! ]8 U k* R/ g4.3、黄聪:搜集引擎信息查询服务-生成搜索结果页
. u1 |$ l+ g% q4.4、黄聪:搜集引擎信息查询服务-搜索结果页缓存
% c i7 ~1 \* b: W! N5.1、黄聪:用户行为分析-用户查询与点击日志
# u H4 [4 i [+ H1 Y% c+ s$ `5.2、黄聪:用户行为分析-查询日志分析
" \: O2 F: l3 @+ \1 z5.3、黄聪:用户行为分析-点击日志分析
9 Z( W0 }2 h/ p2 y$ p6.1、黄聪:相关排序-网页权重的计算
: d/ X+ d# R R* a1 u# i9 [! B7 K6.2、黄聪:相关排序-网页词项权重的计算- }0 d7 V+ ^/ O5 q
6.3、黄聪:相关排序-链接权值的计算
@9 H" ~8 @7 y6.4、黄聪:相关排序-用户评价权值的计算) j8 K# Z/ }* e2 J6 S6 o
6.5、黄聪:相关排序-最终权值的计算 w: V7 X% g& J
7、黄聪:中文网页自动分类技术/ v5 b4 p3 S3 o
8、黄聪:搜索引擎工作原理总结
1 V) ?" I& _. g6 z% m( S2 D( K附1、黄聪:如何在WIN7下使用Virtualbox安装Ubuntu
) q) E% ?- P* P+ e. p) p# z9 N6 H附2、黄聪:如何搭建TSE搜索引擎. z# w, B& _% C7 }
附3、黄聪:如何让TSE搜索引擎重新抓取网页
' Y3 V# i$ a: V% ]: a8 e! {. T+ g* C Q
下载地址:https://pan.baidu.com/s/1gPW1h, v& C% D7 Y6 u7 z4 O
|
|