|
|
1.1.1、黄聪:搜索引擎的工作原理-基础要求
* x6 Y, v/ c( f7 S! m( o1.1.2、黄聪:搜索引擎工作原理-网页搜索基础简介8 l8 J+ k! P: s7 h8 z
1.1.3、黄聪:搜索引擎工作原理-预处理基础简介
0 o4 K+ ^( q0 w# ^4 H% q1.1.4、黄聪:搜索引擎工作原理-查询服务基础简介7 z9 N5 p& G% [( Y( C+ J+ q
1.1.5、黄聪:搜索引擎工作原理-体系结构
# Z& h; J* D6 [2.1、黄聪:页面搜集原理、技术和系统-基础知识
, x b! Q; R5 R: o9 ~5 h2.2、黄聪:页面搜集原理、技术和系统-搜集过程) [$ Z( B5 n9 M+ [. y6 U# c( A" {
2.3、黄聪:页面搜集原理、技术和系统-天网存储结构定义
. s4 ^+ X# i* m, B7 _, K2.4、黄聪:页面搜集原理、技术和系统-如何避免网页重复搜集
! B2 n* A# G. w0 D- ^. [3 m. o7 |2.5、黄聪:页面搜集原理、技术和系统-如何首先搜集重要的网页$ Q+ Q7 ?/ i7 i0 g4 E1 ~; a1 m
2.6、黄聪:页面搜集原理、技术和系统-可扩展搜索子系统
) g; E. Y. H# b3 ] d7 Q7 I5 E2.6.1、黄聪:可扩展搜索子系统-节点间URL的划分策略
+ ] l# c+ L# @7 Y" b+ Y2.6.2、黄聪:可扩展搜索子系统-系统的动态可配置性设计
6 H. R+ z# B9 ?3.1、黄聪:搜集信息的预处理-系统结构0 w- e5 M: Q6 i+ {5 e
3.1.1、黄聪:搜集信息的预处理-索引网页库+ m: u4 g8 Y! O& C
3.1.2、黄聪:搜集信息的预处理-中文分词技术0 }/ Q$ B6 k; p9 p% w6 h# l
3.1.3、黄聪:搜集信息的预处理-分析页面和建立倒排文件1 O2 w8 P5 v6 C& C- y' Q0 u: I
3.2、黄聪:搜集信息的预处理-网页净化和消重
0 \1 ^3 M. M: W' k" A* m$ L3.2.1、黄聪:搜集信息的预处理-净化与数据提取
& B3 o/ `2 u+ N) p% B3 X1 H7 A3.2.2、黄聪:搜集信息的预处理-网页消重, I6 d) l- \% o* a+ b$ Q
4.1、黄聪:搜集引擎信息查询服务-网页信息检索- }# ?6 Y1 f( S4 _% C F
4.2、黄聪:搜集引擎信息查询服务-中文自动摘要
7 o+ B( j) ]- P* S4.3、黄聪:搜集引擎信息查询服务-生成搜索结果页
3 p6 o8 ^# d- z" U# f8 s( F4.4、黄聪:搜集引擎信息查询服务-搜索结果页缓存
3 _( v: t" m q- `0 C. I C7 F5.1、黄聪:用户行为分析-用户查询与点击日志1 q: b- s8 R$ O( K, c
5.2、黄聪:用户行为分析-查询日志分析9 o5 U+ o1 n+ l. ]
5.3、黄聪:用户行为分析-点击日志分析1 P+ U9 ? I7 x/ O. o2 N
6.1、黄聪:相关排序-网页权重的计算, k8 W, r4 `( W& {, f
6.2、黄聪:相关排序-网页词项权重的计算
+ ~8 r+ x! e8 X# t0 f5 O$ D6 B6.3、黄聪:相关排序-链接权值的计算* ]: S+ l$ c' z- n( R' u' f# y
6.4、黄聪:相关排序-用户评价权值的计算
4 }/ k# c3 X: \6.5、黄聪:相关排序-最终权值的计算& [. U" Q- y$ D: c% V. v+ k
7、黄聪:中文网页自动分类技术
! M" x% M' I6 o+ Z3 j8、黄聪:搜索引擎工作原理总结 z# Q6 i$ j9 B5 s
附1、黄聪:如何在WIN7下使用Virtualbox安装Ubuntu
$ L. m* H. d( B* r4 H附2、黄聪:如何搭建TSE搜索引擎, [9 Q% G0 _2 h7 g
附3、黄聪:如何让TSE搜索引擎重新抓取网页
5 ]' k6 y. s# U9 r9 U- V+ V. t" s. F% Y8 X/ D1 ~* s8 m- l
下载地址:https://pan.baidu.com/s/1gPW1h
5 E2 Y7 H/ j! Y3 r. X) t* @- Y |
|