|
|
1.1.1、黄聪:搜索引擎的工作原理-基础要求+ S z2 h1 y1 `0 A1 z
1.1.2、黄聪:搜索引擎工作原理-网页搜索基础简介. v0 O. f8 f) l
1.1.3、黄聪:搜索引擎工作原理-预处理基础简介
) ~; B, u& i- f3 `' \) I4 ~( k1.1.4、黄聪:搜索引擎工作原理-查询服务基础简介8 y* a1 U. g1 H( ] Q" w, U
1.1.5、黄聪:搜索引擎工作原理-体系结构. ~! q$ E# n: k) a2 @$ u0 z) W Y
2.1、黄聪:页面搜集原理、技术和系统-基础知识
$ {; p1 q I; [1 s# A( r2.2、黄聪:页面搜集原理、技术和系统-搜集过程
2 j& w) r9 i7 \. |. h2 c$ h3 m' c2.3、黄聪:页面搜集原理、技术和系统-天网存储结构定义# Q8 b9 R+ H0 L2 W8 `+ d! F
2.4、黄聪:页面搜集原理、技术和系统-如何避免网页重复搜集+ C7 H. R: M" \7 S7 e6 t9 j" P3 s& W
2.5、黄聪:页面搜集原理、技术和系统-如何首先搜集重要的网页
! I$ P/ N, m! F$ |9 I7 ~$ j2.6、黄聪:页面搜集原理、技术和系统-可扩展搜索子系统* Q8 r/ E0 w% p) j
2.6.1、黄聪:可扩展搜索子系统-节点间URL的划分策略# o9 y/ |; q3 C) M
2.6.2、黄聪:可扩展搜索子系统-系统的动态可配置性设计! K& G. ?% } [
3.1、黄聪:搜集信息的预处理-系统结构% i0 g- t9 W2 d
3.1.1、黄聪:搜集信息的预处理-索引网页库
7 Y+ M7 \1 X# G3.1.2、黄聪:搜集信息的预处理-中文分词技术
. T, a+ Q, L/ C% y% P3.1.3、黄聪:搜集信息的预处理-分析页面和建立倒排文件/ H6 s; [ ]# j
3.2、黄聪:搜集信息的预处理-网页净化和消重
6 Q2 O; q# H( ^6 C7 l0 p4 \3.2.1、黄聪:搜集信息的预处理-净化与数据提取% n6 L& o$ p7 \3 ]3 a! E6 g; R% {
3.2.2、黄聪:搜集信息的预处理-网页消重3 C. G* u5 s- Y* _; \
4.1、黄聪:搜集引擎信息查询服务-网页信息检索0 T5 \0 H/ B- [; H5 }& q2 u; V
4.2、黄聪:搜集引擎信息查询服务-中文自动摘要
- g* S+ E% b H4 f& t5 W4.3、黄聪:搜集引擎信息查询服务-生成搜索结果页9 q- E( ~6 n& Q( c- d9 S/ x# G" b* e8 x
4.4、黄聪:搜集引擎信息查询服务-搜索结果页缓存8 ~9 k. w; F; @6 P% h& c
5.1、黄聪:用户行为分析-用户查询与点击日志/ X- E# {; K/ a ?( Z' S5 X5 ]! @
5.2、黄聪:用户行为分析-查询日志分析
7 c5 ?9 l+ x4 l4 U5.3、黄聪:用户行为分析-点击日志分析
9 ]2 E& D, y1 F- k D3 Y' t8 U6.1、黄聪:相关排序-网页权重的计算0 ]. T' v. _- U" @, o H9 y; g
6.2、黄聪:相关排序-网页词项权重的计算
/ r. G/ { J& O: L+ ]) D6.3、黄聪:相关排序-链接权值的计算
3 u' C2 ]5 j4 L- B# m A7 B6.4、黄聪:相关排序-用户评价权值的计算( m$ a* ^. R3 Z" G0 e& s3 r8 j
6.5、黄聪:相关排序-最终权值的计算/ D3 c- p2 d0 {. ~2 X0 }3 f
7、黄聪:中文网页自动分类技术4 \7 n$ x- {: V3 x
8、黄聪:搜索引擎工作原理总结
: j% N9 T" ? X; F8 t附1、黄聪:如何在WIN7下使用Virtualbox安装Ubuntu1 @3 F* {) t w" d0 e
附2、黄聪:如何搭建TSE搜索引擎
6 Y3 e3 f Q: ?附3、黄聪:如何让TSE搜索引擎重新抓取网页) j5 e* I. z9 O2 x( U' K9 g& x5 j
U: O3 V6 B ?, D& f% H1 s3 B9 r* `' y下载地址:https://pan.baidu.com/s/1gPW1h
! t6 u- c3 w: Z/ }- u; `8 { |
|