|
1.1.1、黄聪:搜索引擎的工作原理-基础要求: S. U7 t8 a# a
1.1.2、黄聪:搜索引擎工作原理-网页搜索基础简介
. h" P+ ]6 ~& y W0 o1 x1.1.3、黄聪:搜索引擎工作原理-预处理基础简介
8 @$ z( O5 ]$ u; ]: X1.1.4、黄聪:搜索引擎工作原理-查询服务基础简介
! m! ~3 r0 B+ L/ c" W1.1.5、黄聪:搜索引擎工作原理-体系结构
$ |$ i" i/ q5 }" K0 ], f% H* L: `, ~2.1、黄聪:页面搜集原理、技术和系统-基础知识1 I2 j3 `% Z: r. d
2.2、黄聪:页面搜集原理、技术和系统-搜集过程
# }" H: }% O: F0 J# e) c% Q2.3、黄聪:页面搜集原理、技术和系统-天网存储结构定义 ~ u# ^0 d: q
2.4、黄聪:页面搜集原理、技术和系统-如何避免网页重复搜集4 s, j3 e4 d( ]2 V$ {, E
2.5、黄聪:页面搜集原理、技术和系统-如何首先搜集重要的网页
, ~" M1 Y5 S8 k2.6、黄聪:页面搜集原理、技术和系统-可扩展搜索子系统 e0 g5 W# m9 I. ]
2.6.1、黄聪:可扩展搜索子系统-节点间URL的划分策略) K4 T# Z; A1 m% V
2.6.2、黄聪:可扩展搜索子系统-系统的动态可配置性设计
% K2 V4 C/ Z( z3 C" M3.1、黄聪:搜集信息的预处理-系统结构( C% N9 Y9 n2 A9 ~5 f. l8 z
3.1.1、黄聪:搜集信息的预处理-索引网页库7 z, Q0 w1 q6 c/ Z
3.1.2、黄聪:搜集信息的预处理-中文分词技术
k& _3 Q1 B. Q3.1.3、黄聪:搜集信息的预处理-分析页面和建立倒排文件
& W7 W8 Q! R0 ?' q' B/ Q3.2、黄聪:搜集信息的预处理-网页净化和消重. \* i N+ {# q9 q$ D
3.2.1、黄聪:搜集信息的预处理-净化与数据提取
3 q3 n: q0 v) U& y) }3.2.2、黄聪:搜集信息的预处理-网页消重
* L1 I' O4 b/ a) a! K" ]8 v$ V( d4.1、黄聪:搜集引擎信息查询服务-网页信息检索. Y& v8 G9 t5 ~/ j; o
4.2、黄聪:搜集引擎信息查询服务-中文自动摘要; g1 x# T6 G5 [; Z6 S/ r
4.3、黄聪:搜集引擎信息查询服务-生成搜索结果页
) U6 z! v8 \/ w4 C" Q4.4、黄聪:搜集引擎信息查询服务-搜索结果页缓存
6 p- n: s* n- k3 X) g8 p5.1、黄聪:用户行为分析-用户查询与点击日志2 x1 c% I* M! q0 V! F
5.2、黄聪:用户行为分析-查询日志分析1 a" J4 |" s! j% m/ K/ d
5.3、黄聪:用户行为分析-点击日志分析& i$ u) k6 m3 @' q6 G, \1 s4 l
6.1、黄聪:相关排序-网页权重的计算
) t7 Y2 E# Q0 F0 {# C, z4 l6.2、黄聪:相关排序-网页词项权重的计算) Q! e! M `: e0 f
6.3、黄聪:相关排序-链接权值的计算
% q4 a8 F6 q1 S! `7 G) K, q2 J: @6.4、黄聪:相关排序-用户评价权值的计算
7 ^8 T( t7 t) y6.5、黄聪:相关排序-最终权值的计算
8 N0 ?2 ~3 t; Q i% L3 U7、黄聪:中文网页自动分类技术
8 {* {# t( _/ ]3 }8、黄聪:搜索引擎工作原理总结
4 o# w# [6 p% r# x/ `7 L# J附1、黄聪:如何在WIN7下使用Virtualbox安装Ubuntu+ O$ u- A/ R! y1 n2 [: m1 u
附2、黄聪:如何搭建TSE搜索引擎
+ ^- w) j9 r/ U* T: x" V附3、黄聪:如何让TSE搜索引擎重新抓取网页
9 B. p! U6 q" Q/ z. N" J. G. T& t: ~/ A: |+ @0 z5 z# W0 X
下载地址:https://pan.baidu.com/s/1gPW1h
: T2 G7 A' w/ Z2 z: R |
|