|
1.1.1、黄聪:搜索引擎的工作原理-基础要求- t: N# ~% r% `# e' ^8 c
1.1.2、黄聪:搜索引擎工作原理-网页搜索基础简介7 z* C( y& T7 f6 L, S) b1 h" q' c
1.1.3、黄聪:搜索引擎工作原理-预处理基础简介
- b8 n) u, L: r" M1.1.4、黄聪:搜索引擎工作原理-查询服务基础简介* E# y! d; t n3 r! ?$ b* F
1.1.5、黄聪:搜索引擎工作原理-体系结构 }" y5 T$ r7 L5 n
2.1、黄聪:页面搜集原理、技术和系统-基础知识+ Q, m8 f. S$ m# {2 D* Q! ?- n
2.2、黄聪:页面搜集原理、技术和系统-搜集过程: @& g: ~6 ?) r6 j/ s
2.3、黄聪:页面搜集原理、技术和系统-天网存储结构定义
$ L# b0 k; a( l2.4、黄聪:页面搜集原理、技术和系统-如何避免网页重复搜集
3 [2 ]% H, U0 e8 y9 C S6 E2.5、黄聪:页面搜集原理、技术和系统-如何首先搜集重要的网页4 s. T. h- T5 W, r8 s) e; Q( I3 P
2.6、黄聪:页面搜集原理、技术和系统-可扩展搜索子系统1 \( D( x- i2 [7 i& T, ^" P. D
2.6.1、黄聪:可扩展搜索子系统-节点间URL的划分策略' g2 v7 O, r9 P6 A" I3 N4 }
2.6.2、黄聪:可扩展搜索子系统-系统的动态可配置性设计
2 [5 \. [1 t! u. V2 h# ?& V2 Z. s# E3.1、黄聪:搜集信息的预处理-系统结构$ ^! I# j7 P, B
3.1.1、黄聪:搜集信息的预处理-索引网页库
' x0 y' R# {" C& F3.1.2、黄聪:搜集信息的预处理-中文分词技术
% ]2 D4 v" a5 j" B3.1.3、黄聪:搜集信息的预处理-分析页面和建立倒排文件
; f# ^( e6 a1 ~" O$ F3.2、黄聪:搜集信息的预处理-网页净化和消重
, C) @3 M% I F0 Q3.2.1、黄聪:搜集信息的预处理-净化与数据提取. x5 U& L6 g; c. ^" i' A( g& m
3.2.2、黄聪:搜集信息的预处理-网页消重* g! _& {3 i5 O
4.1、黄聪:搜集引擎信息查询服务-网页信息检索+ \) S! @# F6 P* p
4.2、黄聪:搜集引擎信息查询服务-中文自动摘要
4 F+ F* c0 E/ W5 c# P4.3、黄聪:搜集引擎信息查询服务-生成搜索结果页
6 ], a L& t+ z" l2 u1 y4.4、黄聪:搜集引擎信息查询服务-搜索结果页缓存
8 [+ a8 o1 k3 W8 X8 o5.1、黄聪:用户行为分析-用户查询与点击日志/ l0 [9 z( c7 k: U6 u5 o( C
5.2、黄聪:用户行为分析-查询日志分析8 n- ~+ ] m* m& x, C
5.3、黄聪:用户行为分析-点击日志分析, O% z" Y L% G) a" a- w
6.1、黄聪:相关排序-网页权重的计算
' F S8 w& p3 x4 h x) A6 f2 }7 q6.2、黄聪:相关排序-网页词项权重的计算, d$ L/ f K8 t" I( m( B
6.3、黄聪:相关排序-链接权值的计算
6 A4 P5 a' ~. m& k2 C/ f- c6.4、黄聪:相关排序-用户评价权值的计算/ E0 Q% S V: o+ a2 x6 @4 O0 p
6.5、黄聪:相关排序-最终权值的计算
, K' m' F1 x0 n0 S7、黄聪:中文网页自动分类技术
, ` H0 E6 S$ }( I: c7 Z" k+ Q& u8、黄聪:搜索引擎工作原理总结
3 b: N6 t! s. F2 H: v附1、黄聪:如何在WIN7下使用Virtualbox安装Ubuntu5 p& z$ E* v9 `( {# y2 j( c6 [/ V
附2、黄聪:如何搭建TSE搜索引擎
" A2 `2 M' N; E+ r8 p& p& J附3、黄聪:如何让TSE搜索引擎重新抓取网页: x7 a" ~& U: D8 ?+ q1 q. b1 @
% ~3 r3 K5 R+ l+ ?
下载地址:https://pan.baidu.com/s/1gPW1h+ w5 e$ T3 d+ D' J6 i% \) E
|
|