|
|
1.1.1、黄聪:搜索引擎的工作原理-基础要求
- i, k2 T. M" B M- Y. C9 B3 e+ N1.1.2、黄聪:搜索引擎工作原理-网页搜索基础简介0 q- |* f4 T: T8 h0 C
1.1.3、黄聪:搜索引擎工作原理-预处理基础简介
2 r7 l/ h6 ?. u2 I; }4 a7 ~) S1.1.4、黄聪:搜索引擎工作原理-查询服务基础简介
9 z3 P# w* I( w, |: Z" Y1.1.5、黄聪:搜索引擎工作原理-体系结构
. \, r. A/ r: E" F2.1、黄聪:页面搜集原理、技术和系统-基础知识
5 W% \4 u. Z9 u4 O. Z; t# O2.2、黄聪:页面搜集原理、技术和系统-搜集过程
' G+ Q; A0 o5 g7 {- s6 H2.3、黄聪:页面搜集原理、技术和系统-天网存储结构定义
1 E0 G- x$ p- r$ J2.4、黄聪:页面搜集原理、技术和系统-如何避免网页重复搜集# h* M# A( | T# T1 L: _0 V
2.5、黄聪:页面搜集原理、技术和系统-如何首先搜集重要的网页
# P/ o! H" M1 |3 U2.6、黄聪:页面搜集原理、技术和系统-可扩展搜索子系统7 e' ?6 m2 o2 l
2.6.1、黄聪:可扩展搜索子系统-节点间URL的划分策略
1 y' v/ a7 n2 {2.6.2、黄聪:可扩展搜索子系统-系统的动态可配置性设计
0 Q& a3 m( \& Z$ m( B9 f% m3.1、黄聪:搜集信息的预处理-系统结构
+ F5 S7 j) X3 B. c/ v0 {3.1.1、黄聪:搜集信息的预处理-索引网页库: c+ O! J1 D _# Q: N6 _+ H4 ~
3.1.2、黄聪:搜集信息的预处理-中文分词技术3 T, g# h- s9 Z( U& {* n+ K& M4 }
3.1.3、黄聪:搜集信息的预处理-分析页面和建立倒排文件: K; b. U1 M5 D" J
3.2、黄聪:搜集信息的预处理-网页净化和消重
% Q) V4 u9 a; I/ T* F8 ]3.2.1、黄聪:搜集信息的预处理-净化与数据提取7 T/ @5 B% r% L D2 G7 k }; e
3.2.2、黄聪:搜集信息的预处理-网页消重& J$ B+ U; M' u* j+ ~4 [; u; j1 U, Y0 K5 [
4.1、黄聪:搜集引擎信息查询服务-网页信息检索
& I0 T7 x6 Z/ G7 ]6 n& L$ ?4.2、黄聪:搜集引擎信息查询服务-中文自动摘要( r- ^$ Z3 D" Q
4.3、黄聪:搜集引擎信息查询服务-生成搜索结果页) [& r/ ^% p4 ^* q
4.4、黄聪:搜集引擎信息查询服务-搜索结果页缓存
" E5 z1 H: v* n! y1 ~5.1、黄聪:用户行为分析-用户查询与点击日志
1 k: r/ P: @, H4 ^9 {4 b* L5 |5.2、黄聪:用户行为分析-查询日志分析
4 X7 S* A0 b' `/ Z5.3、黄聪:用户行为分析-点击日志分析, A0 ?- w; l) g1 I6 u8 r. E4 F2 ^
6.1、黄聪:相关排序-网页权重的计算
& n- Z9 Y) G) P! P6.2、黄聪:相关排序-网页词项权重的计算
6 ?# E4 l4 A4 |4 K8 I* n2 ~6.3、黄聪:相关排序-链接权值的计算
3 r2 o- a, m" y7 x3 ^+ j% t6.4、黄聪:相关排序-用户评价权值的计算
3 z, m \& ~6 w' M& F7 a4 \6.5、黄聪:相关排序-最终权值的计算% f( v. ]8 [: v7 @$ z0 n9 u
7、黄聪:中文网页自动分类技术
9 ?! E8 b8 W2 c, x% C u6 l8、黄聪:搜索引擎工作原理总结5 m) N/ C) [- |# S: G: S
附1、黄聪:如何在WIN7下使用Virtualbox安装Ubuntu
( \! L4 C+ C1 K( i- T; V0 v附2、黄聪:如何搭建TSE搜索引擎
8 y6 C& |7 T" m$ s/ C附3、黄聪:如何让TSE搜索引擎重新抓取网页# D' p P9 u. |3 h3 Z' X' u
" b4 v& \; S: u8 I* n
下载地址:https://pan.baidu.com/s/1gPW1h' x6 n; l0 P6 Y. k
|
|