|
1.1.1、黄聪:搜索引擎的工作原理-基础要求
& [7 S' s, ]2 R7 h1.1.2、黄聪:搜索引擎工作原理-网页搜索基础简介* V) f( ^1 a6 z! V8 |5 M
1.1.3、黄聪:搜索引擎工作原理-预处理基础简介1 \# T; v; B/ Q2 m1 `
1.1.4、黄聪:搜索引擎工作原理-查询服务基础简介
0 X i. h7 x0 u t1.1.5、黄聪:搜索引擎工作原理-体系结构
: d; X8 \: {" z3 V6 Y' i2.1、黄聪:页面搜集原理、技术和系统-基础知识% Z- o$ J9 [- w: O
2.2、黄聪:页面搜集原理、技术和系统-搜集过程
* u. ^. T5 g- X9 o( G: ~; W2.3、黄聪:页面搜集原理、技术和系统-天网存储结构定义
0 N" \7 w3 |* I4 z$ W$ `5 H7 ^2.4、黄聪:页面搜集原理、技术和系统-如何避免网页重复搜集. v: v# @* K$ C3 S1 |
2.5、黄聪:页面搜集原理、技术和系统-如何首先搜集重要的网页
% m1 C( k* O U/ i2.6、黄聪:页面搜集原理、技术和系统-可扩展搜索子系统0 c! f5 x3 l4 r! x
2.6.1、黄聪:可扩展搜索子系统-节点间URL的划分策略+ Y( f" q& R; z5 G
2.6.2、黄聪:可扩展搜索子系统-系统的动态可配置性设计
7 [$ Z! H6 l3 L5 L3 D- Q) ?3.1、黄聪:搜集信息的预处理-系统结构
, C, h: Y* f9 [. z. i3.1.1、黄聪:搜集信息的预处理-索引网页库
) G/ I7 K* b4 \' u' x/ W3.1.2、黄聪:搜集信息的预处理-中文分词技术
5 ~. l g. \, S% b4 `# R: I2 T3.1.3、黄聪:搜集信息的预处理-分析页面和建立倒排文件; E9 U9 W3 q! s' z
3.2、黄聪:搜集信息的预处理-网页净化和消重/ P' p* K/ o" i9 T3 M7 x) g
3.2.1、黄聪:搜集信息的预处理-净化与数据提取
5 J; e. n& o8 v" y0 A( }: G/ A A2 r3.2.2、黄聪:搜集信息的预处理-网页消重
; g6 f% T7 B" |8 K4.1、黄聪:搜集引擎信息查询服务-网页信息检索( u0 c% _" w0 B' F6 Q% ^' p% }
4.2、黄聪:搜集引擎信息查询服务-中文自动摘要
& k3 p& f2 S6 \/ P0 z" P4.3、黄聪:搜集引擎信息查询服务-生成搜索结果页
u' }( _: S# o& X5 P% ^! j4.4、黄聪:搜集引擎信息查询服务-搜索结果页缓存
4 x# q. f9 Z8 |9 b% O9 M, E8 Y& O5.1、黄聪:用户行为分析-用户查询与点击日志
. D$ i' Y; H0 x4 S2 I8 S2 @5.2、黄聪:用户行为分析-查询日志分析
4 \2 ^& G1 z* s+ H6 d! z' P8 {9 i5.3、黄聪:用户行为分析-点击日志分析
* }( V! u, ]# c# y6.1、黄聪:相关排序-网页权重的计算" L6 {0 C' I. s5 w7 B9 O; S$ N
6.2、黄聪:相关排序-网页词项权重的计算" }( t5 n, \# h. V
6.3、黄聪:相关排序-链接权值的计算 o( j2 n+ @8 w" h) M' d
6.4、黄聪:相关排序-用户评价权值的计算, m; ?$ a# s( q5 n' n: _+ U
6.5、黄聪:相关排序-最终权值的计算3 C8 m6 ]1 X! v) z2 f! H
7、黄聪:中文网页自动分类技术
) m: T. S+ d+ t7 q5 p8、黄聪:搜索引擎工作原理总结
, q& _- j! H' D0 E- m4 ~" L" C s: G附1、黄聪:如何在WIN7下使用Virtualbox安装Ubuntu
3 u$ K1 s5 W* |1 A6 U: r附2、黄聪:如何搭建TSE搜索引擎( h0 ^) ?+ P9 c
附3、黄聪:如何让TSE搜索引擎重新抓取网页5 x# c1 Q5 |/ B' H' Y. e) |6 G! [
. `+ |% p1 m' T& t6 y* _ L2 f+ P下载地址:https://pan.baidu.com/s/1gPW1h
8 J. F- ?0 q5 {" m |
|