|
1.1.1、黄聪:搜索引擎的工作原理-基础要求
1 a. z! z9 f+ P- x' p# B' S. [# N1.1.2、黄聪:搜索引擎工作原理-网页搜索基础简介, D7 u2 d3 R. \
1.1.3、黄聪:搜索引擎工作原理-预处理基础简介
/ v W5 k5 k. t! Y! R: l0 T: X- k1.1.4、黄聪:搜索引擎工作原理-查询服务基础简介
n3 t I( w9 N/ s" g9 c3 y1.1.5、黄聪:搜索引擎工作原理-体系结构- v9 [, r1 _8 [6 I: n) N
2.1、黄聪:页面搜集原理、技术和系统-基础知识
! w! E: _. C5 k. Y' X2.2、黄聪:页面搜集原理、技术和系统-搜集过程
; p$ I: g+ ?7 Z& v5 O; k. O; e2.3、黄聪:页面搜集原理、技术和系统-天网存储结构定义
' m) h& j$ `- Z- T# h2.4、黄聪:页面搜集原理、技术和系统-如何避免网页重复搜集
( O; ]) N4 d2 P, \ r3 m2 }7 [$ Y2.5、黄聪:页面搜集原理、技术和系统-如何首先搜集重要的网页7 ]" \# ^6 a- `# Z* m
2.6、黄聪:页面搜集原理、技术和系统-可扩展搜索子系统( m2 u& D$ Q& N$ Z+ y; Q; R
2.6.1、黄聪:可扩展搜索子系统-节点间URL的划分策略
, R) I0 u, J2 G% ]2 y% Y$ A5 r2.6.2、黄聪:可扩展搜索子系统-系统的动态可配置性设计
" ?3 \$ [( P* O, `. e3.1、黄聪:搜集信息的预处理-系统结构' x9 B! \2 o1 ~2 s/ [
3.1.1、黄聪:搜集信息的预处理-索引网页库
9 C w6 m0 l) ~( l3.1.2、黄聪:搜集信息的预处理-中文分词技术/ }* e" ^& C+ \+ q: r( h/ l
3.1.3、黄聪:搜集信息的预处理-分析页面和建立倒排文件
3 z- E0 [7 X C) g) Y- e- R/ d3.2、黄聪:搜集信息的预处理-网页净化和消重) P$ A# O: I0 _& Y
3.2.1、黄聪:搜集信息的预处理-净化与数据提取0 x1 b. L! n6 A: a% g
3.2.2、黄聪:搜集信息的预处理-网页消重
& ~0 i% N& i0 L1 c4.1、黄聪:搜集引擎信息查询服务-网页信息检索2 G% a) z6 _, S: t" s1 I, e
4.2、黄聪:搜集引擎信息查询服务-中文自动摘要* J: g: X0 f5 s. h0 z0 F
4.3、黄聪:搜集引擎信息查询服务-生成搜索结果页* M7 r. F2 G( W9 S/ P8 y; O
4.4、黄聪:搜集引擎信息查询服务-搜索结果页缓存9 J3 O ^' U. k8 ^! i- s
5.1、黄聪:用户行为分析-用户查询与点击日志
( J& b2 y( {; H. U- @ g* `9 `3 q5.2、黄聪:用户行为分析-查询日志分析
6 O$ s Z/ {6 [8 d& t5.3、黄聪:用户行为分析-点击日志分析
$ E+ f/ t( P( X- y& G' U# ]2 T2 |6.1、黄聪:相关排序-网页权重的计算
, F9 \! [) q D2 ~( b6.2、黄聪:相关排序-网页词项权重的计算
, ^7 |# f1 y1 {6.3、黄聪:相关排序-链接权值的计算
5 R; @. m1 E( ]; N7 T8 O: {6.4、黄聪:相关排序-用户评价权值的计算
' D5 z7 h) j1 t% J/ O6.5、黄聪:相关排序-最终权值的计算
' t) e# V: v/ N7、黄聪:中文网页自动分类技术5 M" |. D8 u6 |1 r/ C
8、黄聪:搜索引擎工作原理总结
?# K W( l# H附1、黄聪:如何在WIN7下使用Virtualbox安装Ubuntu1 O+ {' y4 N- Z( j& I
附2、黄聪:如何搭建TSE搜索引擎
) Q1 g, J9 E! V4 N6 S. Q附3、黄聪:如何让TSE搜索引擎重新抓取网页" T9 ^0 x7 Z: s% Y+ @0 @
% l# _& R3 q" L$ g' T下载地址:https://pan.baidu.com/s/1gPW1h
: f/ G3 J. n- f1 r |
|