|
1.1.1、黄聪:搜索引擎的工作原理-基础要求
/ v# C* W' ]5 j3 `, ~1.1.2、黄聪:搜索引擎工作原理-网页搜索基础简介" t' r4 y: o; r/ d2 Y0 C
1.1.3、黄聪:搜索引擎工作原理-预处理基础简介
9 e% A# x+ Q- |1 x' k( Z/ {. N% X1.1.4、黄聪:搜索引擎工作原理-查询服务基础简介
1 B) u) I) T! _3 V1 B1.1.5、黄聪:搜索引擎工作原理-体系结构
Q7 d- U' I! |( I0 x- s. ^( m( k% ?2.1、黄聪:页面搜集原理、技术和系统-基础知识- D3 g6 u* Q" _ H# t: T! @# f
2.2、黄聪:页面搜集原理、技术和系统-搜集过程
0 \5 d9 V. i! T9 q. e2.3、黄聪:页面搜集原理、技术和系统-天网存储结构定义
( N3 w% g+ y7 V- m% g5 L2.4、黄聪:页面搜集原理、技术和系统-如何避免网页重复搜集; }. f; k4 B: \) I- \
2.5、黄聪:页面搜集原理、技术和系统-如何首先搜集重要的网页
6 m. K+ |8 c6 m$ u6 B2.6、黄聪:页面搜集原理、技术和系统-可扩展搜索子系统
3 f9 }( x1 h0 ]) \9 i2.6.1、黄聪:可扩展搜索子系统-节点间URL的划分策略9 m" k0 i+ c& i+ w; F
2.6.2、黄聪:可扩展搜索子系统-系统的动态可配置性设计2 N; A4 L( O* H* |/ Q6 [
3.1、黄聪:搜集信息的预处理-系统结构
4 O/ i% y# W" c5 T. L- I6 \3.1.1、黄聪:搜集信息的预处理-索引网页库
1 \ }1 O$ j. ~9 U3.1.2、黄聪:搜集信息的预处理-中文分词技术6 F, ], i9 X5 V' u: I$ j" j9 G
3.1.3、黄聪:搜集信息的预处理-分析页面和建立倒排文件
" L: n9 d. E- k, e- \8 C3.2、黄聪:搜集信息的预处理-网页净化和消重
" I& V' J# a8 X6 f. p8 s& B3.2.1、黄聪:搜集信息的预处理-净化与数据提取
4 Y6 s* ]2 J' B. b0 E. x5 t7 X3.2.2、黄聪:搜集信息的预处理-网页消重7 I; K% R/ A/ J$ X/ o
4.1、黄聪:搜集引擎信息查询服务-网页信息检索& A Q' n @, S2 |3 V6 m( |
4.2、黄聪:搜集引擎信息查询服务-中文自动摘要( z9 N. _( @5 T, P- C, T
4.3、黄聪:搜集引擎信息查询服务-生成搜索结果页
* k* u3 d* Z- T/ `9 N4.4、黄聪:搜集引擎信息查询服务-搜索结果页缓存
' _# I0 ]1 o$ @2 U* u& N" x5.1、黄聪:用户行为分析-用户查询与点击日志) w. L R3 W, [: f' I( C0 L6 L
5.2、黄聪:用户行为分析-查询日志分析1 E6 Z- e6 D, U4 d3 g" e, E, c
5.3、黄聪:用户行为分析-点击日志分析
9 r: A y2 [. A4 p, K: K6.1、黄聪:相关排序-网页权重的计算1 b! n: r( O* @8 o" V# e
6.2、黄聪:相关排序-网页词项权重的计算! E( g$ |6 m5 I- f
6.3、黄聪:相关排序-链接权值的计算) a3 R7 W" c4 d, I) w
6.4、黄聪:相关排序-用户评价权值的计算7 j+ Q5 C2 D) J
6.5、黄聪:相关排序-最终权值的计算
* h2 I# h! l7 v8 {! ~7、黄聪:中文网页自动分类技术, t( [# K' ?: @5 S( Y
8、黄聪:搜索引擎工作原理总结% _1 w4 [1 V6 t
附1、黄聪:如何在WIN7下使用Virtualbox安装Ubuntu
4 O9 j4 h1 x8 [8 A0 M6 w$ ]附2、黄聪:如何搭建TSE搜索引擎7 L0 S- \5 Q3 ~1 ~
附3、黄聪:如何让TSE搜索引擎重新抓取网页
$ }/ C; ^" @' ?' N( f" j* a: ^ f0 k1 O7 q* C ^6 i
下载地址:https://pan.baidu.com/s/1gPW1h: r' @7 O4 x$ o& h" ~" s2 t
|
|