|
1.1.1、黄聪:搜索引擎的工作原理-基础要求: T, O2 E7 m" D% J! l
1.1.2、黄聪:搜索引擎工作原理-网页搜索基础简介
2 V. i9 o* N. a: H7 J) h1.1.3、黄聪:搜索引擎工作原理-预处理基础简介' B; P/ P0 x: i
1.1.4、黄聪:搜索引擎工作原理-查询服务基础简介: _; Y% b) w: e# y* [
1.1.5、黄聪:搜索引擎工作原理-体系结构
+ u% M/ f4 r0 s- o! {! b9 i. t! y2.1、黄聪:页面搜集原理、技术和系统-基础知识
, `1 }- A; U1 [ R s" {1 V2.2、黄聪:页面搜集原理、技术和系统-搜集过程! {% q. h9 F7 Q
2.3、黄聪:页面搜集原理、技术和系统-天网存储结构定义
* X7 f n& P7 V1 L" R% y2.4、黄聪:页面搜集原理、技术和系统-如何避免网页重复搜集
% z9 k6 R7 s) ?2.5、黄聪:页面搜集原理、技术和系统-如何首先搜集重要的网页" a& ?; u% H, F- {1 a9 n
2.6、黄聪:页面搜集原理、技术和系统-可扩展搜索子系统
6 `6 g0 v1 r; @$ b0 i2.6.1、黄聪:可扩展搜索子系统-节点间URL的划分策略
9 P4 o$ j4 B1 }' B2.6.2、黄聪:可扩展搜索子系统-系统的动态可配置性设计* k. C/ y" f9 x+ s# v0 @7 D& T
3.1、黄聪:搜集信息的预处理-系统结构
7 O+ e9 P# g1 e- S. ^4 Y3.1.1、黄聪:搜集信息的预处理-索引网页库
8 D. R7 ]0 N; C: ~# l" ?' _7 H' j# Y3.1.2、黄聪:搜集信息的预处理-中文分词技术
+ ~& a% X# s" K4 R3 m h% W3.1.3、黄聪:搜集信息的预处理-分析页面和建立倒排文件+ ^# q$ b: {" o9 T- `
3.2、黄聪:搜集信息的预处理-网页净化和消重
1 L n* {. j, ?* [! U& w3.2.1、黄聪:搜集信息的预处理-净化与数据提取
/ y& |& i- }+ p1 A+ ?4 {2 U; V5 U3.2.2、黄聪:搜集信息的预处理-网页消重) p* ~/ s' ]8 ]; ]7 A
4.1、黄聪:搜集引擎信息查询服务-网页信息检索- i9 X3 A1 m F* M3 k
4.2、黄聪:搜集引擎信息查询服务-中文自动摘要
' h v/ e: q x# p6 Y) N& I4.3、黄聪:搜集引擎信息查询服务-生成搜索结果页8 N9 M2 Y( `4 o6 c" O% s% V
4.4、黄聪:搜集引擎信息查询服务-搜索结果页缓存3 Z. c. |! R: B. a- \. l- ^- r* Z
5.1、黄聪:用户行为分析-用户查询与点击日志8 ]7 T0 r- i% s3 ^- M
5.2、黄聪:用户行为分析-查询日志分析, J* F u$ ]; ^4 f4 _
5.3、黄聪:用户行为分析-点击日志分析3 k+ Q% ^, T/ E6 E) j8 ~' ~" P
6.1、黄聪:相关排序-网页权重的计算 U8 p6 m: v. G6 w
6.2、黄聪:相关排序-网页词项权重的计算
6 E. g/ ]/ H5 s; @5 G* y$ M6.3、黄聪:相关排序-链接权值的计算9 i( t* x. N5 P) V* r
6.4、黄聪:相关排序-用户评价权值的计算3 B; X# Y1 |/ z' Y: f: t
6.5、黄聪:相关排序-最终权值的计算
7 }4 P z9 A! M3 f0 s) e+ v* L7、黄聪:中文网页自动分类技术5 y9 S. I/ z3 `" \- |9 M" _
8、黄聪:搜索引擎工作原理总结* o( V" K& x8 h0 i& o' @& x6 C9 [
附1、黄聪:如何在WIN7下使用Virtualbox安装Ubuntu% ] V/ I& _* B0 x+ U# R1 I
附2、黄聪:如何搭建TSE搜索引擎
/ j7 ^8 G. C/ ~+ e3 ^: E附3、黄聪:如何让TSE搜索引擎重新抓取网页
; d0 O. ]5 R% D/ t- Y2 r0 @6 r# I, u) Y3 a- Y
下载地址:https://pan.baidu.com/s/1gPW1h
# a1 x, _2 H0 I. e4 L. s |
|