|
1.1.1、黄聪:搜索引擎的工作原理-基础要求
P0 d! N4 s+ N' l1.1.2、黄聪:搜索引擎工作原理-网页搜索基础简介
4 T% W4 F2 r3 Q1.1.3、黄聪:搜索引擎工作原理-预处理基础简介
O2 y v8 H( C1.1.4、黄聪:搜索引擎工作原理-查询服务基础简介8 n. y, u+ I1 S/ }, e
1.1.5、黄聪:搜索引擎工作原理-体系结构8 v! C; M1 a4 a9 Q
2.1、黄聪:页面搜集原理、技术和系统-基础知识
1 r$ U5 w9 H, K1 b0 K6 b2.2、黄聪:页面搜集原理、技术和系统-搜集过程2 {- E h5 Q2 Z. k5 |: s8 W
2.3、黄聪:页面搜集原理、技术和系统-天网存储结构定义$ A( M9 A% D) i! j
2.4、黄聪:页面搜集原理、技术和系统-如何避免网页重复搜集4 ?# u# }% b+ M3 o
2.5、黄聪:页面搜集原理、技术和系统-如何首先搜集重要的网页+ `/ m1 s- g+ g5 L' [( Y
2.6、黄聪:页面搜集原理、技术和系统-可扩展搜索子系统5 V; w$ W5 _2 M) I
2.6.1、黄聪:可扩展搜索子系统-节点间URL的划分策略
$ T- B# }3 Y/ M- y2.6.2、黄聪:可扩展搜索子系统-系统的动态可配置性设计" o; |, ~" U1 S2 _
3.1、黄聪:搜集信息的预处理-系统结构
2 o5 z. E6 W! _7 c8 }3.1.1、黄聪:搜集信息的预处理-索引网页库* y- |/ h* r. R+ ~; G4 Y2 Y
3.1.2、黄聪:搜集信息的预处理-中文分词技术& s- [2 z; V8 ]; |/ W* C
3.1.3、黄聪:搜集信息的预处理-分析页面和建立倒排文件
8 z: j. Z/ e2 M5 [3.2、黄聪:搜集信息的预处理-网页净化和消重& K) Z, ]; y( ^ ^
3.2.1、黄聪:搜集信息的预处理-净化与数据提取) W$ |5 C, }5 M0 M3 b t( V
3.2.2、黄聪:搜集信息的预处理-网页消重
7 {% P8 M2 W$ s. X: w( X: r4.1、黄聪:搜集引擎信息查询服务-网页信息检索1 V0 x: `5 U1 ]9 P' P2 u' d
4.2、黄聪:搜集引擎信息查询服务-中文自动摘要3 G9 R; |7 w; z0 D
4.3、黄聪:搜集引擎信息查询服务-生成搜索结果页
# e1 @+ U \3 \2 n3 d& A/ _+ u4.4、黄聪:搜集引擎信息查询服务-搜索结果页缓存8 H s8 }* [" E5 G5 u. T; c
5.1、黄聪:用户行为分析-用户查询与点击日志6 t5 ~5 J2 Q) o. o6 Y5 ]( t3 w( C
5.2、黄聪:用户行为分析-查询日志分析7 C3 B% ~( I: U
5.3、黄聪:用户行为分析-点击日志分析* a. C8 w( D7 K+ d& p6 t
6.1、黄聪:相关排序-网页权重的计算& v5 M- C r' |: j! z9 b+ I+ {
6.2、黄聪:相关排序-网页词项权重的计算
$ v$ k( Q. W! C& k4 B( A$ H0 _6.3、黄聪:相关排序-链接权值的计算1 P( S4 b N* N6 d7 u T8 e0 w
6.4、黄聪:相关排序-用户评价权值的计算 d1 |: c% b. U$ Z9 ~+ h
6.5、黄聪:相关排序-最终权值的计算- N& Z6 l- u9 o
7、黄聪:中文网页自动分类技术3 i7 g( }# ]' N/ P- v
8、黄聪:搜索引擎工作原理总结2 u6 F: O; P P) P- D, Q; ^7 a
附1、黄聪:如何在WIN7下使用Virtualbox安装Ubuntu# ]3 {) x# U& F" F# W/ B
附2、黄聪:如何搭建TSE搜索引擎- H0 s* z+ l0 m: A$ @
附3、黄聪:如何让TSE搜索引擎重新抓取网页1 J3 j# B# j* [2 F
1 I# \6 H) `! r3 J' |5 K w下载地址:https://pan.baidu.com/s/1gPW1h* S. C3 q3 I& Z4 D7 a
|
|