|
|
1.1.1、黄聪:搜索引擎的工作原理-基础要求
/ S8 E( Q( H( T8 t ]4 j6 S- }1.1.2、黄聪:搜索引擎工作原理-网页搜索基础简介( U: A T% W, [3 P0 E& |
1.1.3、黄聪:搜索引擎工作原理-预处理基础简介9 F& v% F- y1 E! \# o$ }- K7 ?
1.1.4、黄聪:搜索引擎工作原理-查询服务基础简介& f) a$ { l! R% G! p, N
1.1.5、黄聪:搜索引擎工作原理-体系结构* S0 f# p; r6 q
2.1、黄聪:页面搜集原理、技术和系统-基础知识
' Z F, c& m( ]; Y1 D2.2、黄聪:页面搜集原理、技术和系统-搜集过程4 F3 |! s/ j, N/ n' g# k1 R
2.3、黄聪:页面搜集原理、技术和系统-天网存储结构定义
4 j! B7 Q2 a s2.4、黄聪:页面搜集原理、技术和系统-如何避免网页重复搜集
' S+ V& F$ y+ I( X2.5、黄聪:页面搜集原理、技术和系统-如何首先搜集重要的网页
0 j, P w3 U; Z6 A7 m0 K8 h" W2.6、黄聪:页面搜集原理、技术和系统-可扩展搜索子系统7 p+ @6 W4 _9 C- x& m7 J* w
2.6.1、黄聪:可扩展搜索子系统-节点间URL的划分策略
$ x8 I. S2 P. z; a6 U2.6.2、黄聪:可扩展搜索子系统-系统的动态可配置性设计
9 E2 A! M( W( ~+ F: c3.1、黄聪:搜集信息的预处理-系统结构
0 d( q: C+ a/ ?5 b" V4 N# w- a0 ^3.1.1、黄聪:搜集信息的预处理-索引网页库1 c- l7 ?* k$ W+ ~
3.1.2、黄聪:搜集信息的预处理-中文分词技术; i8 o, o0 L4 {- U3 t5 |0 P
3.1.3、黄聪:搜集信息的预处理-分析页面和建立倒排文件 X! E+ J; @; h% {- P
3.2、黄聪:搜集信息的预处理-网页净化和消重
' e* Y, g: Z. ~# r4 U3.2.1、黄聪:搜集信息的预处理-净化与数据提取% w- n: o% H' R6 \) d
3.2.2、黄聪:搜集信息的预处理-网页消重$ @) E& P% F' Z P
4.1、黄聪:搜集引擎信息查询服务-网页信息检索9 ?0 p1 }% d. w' ~- B
4.2、黄聪:搜集引擎信息查询服务-中文自动摘要4 U' e1 Q" d3 ~
4.3、黄聪:搜集引擎信息查询服务-生成搜索结果页9 E( e) W2 y; x
4.4、黄聪:搜集引擎信息查询服务-搜索结果页缓存
2 m- C( C! }: D1 e& Q/ n p5.1、黄聪:用户行为分析-用户查询与点击日志6 }2 \4 \% B2 F4 _$ C
5.2、黄聪:用户行为分析-查询日志分析4 l1 L# ^- [3 O
5.3、黄聪:用户行为分析-点击日志分析! E7 u* C; L3 C& s) q$ S
6.1、黄聪:相关排序-网页权重的计算7 w5 T* }% \8 I' J% o* `
6.2、黄聪:相关排序-网页词项权重的计算
, r# p8 t Q: Y7 j2 E6.3、黄聪:相关排序-链接权值的计算
: x. m" z1 y* C/ k# y6.4、黄聪:相关排序-用户评价权值的计算
5 t1 U% @/ ?* |8 b6.5、黄聪:相关排序-最终权值的计算" R; v) a# d) I" _# S" V& U
7、黄聪:中文网页自动分类技术
1 R# a7 R" g6 B% R3 p( m% m2 K8、黄聪:搜索引擎工作原理总结& q- C; A0 t& t, `
附1、黄聪:如何在WIN7下使用Virtualbox安装Ubuntu
+ ]+ c8 j* V, E1 r附2、黄聪:如何搭建TSE搜索引擎
8 h9 I3 @0 M0 S1 Y L6 f$ W' W附3、黄聪:如何让TSE搜索引擎重新抓取网页
9 v# M5 X$ @& I; F$ T8 }5 q6 k3 h2 d3 \& A" F. B6 _! i g9 _
下载地址:https://pan.baidu.com/s/1gPW1h
7 K$ X# ^1 U0 M! R' E. y M# { |
|