|
|
1.1.1、黄聪:搜索引擎的工作原理-基础要求
. ]' X2 `3 M( |; ?0 e1.1.2、黄聪:搜索引擎工作原理-网页搜索基础简介
) x. U( D, B1 d' ~1.1.3、黄聪:搜索引擎工作原理-预处理基础简介
* V3 i7 V+ K9 ?1.1.4、黄聪:搜索引擎工作原理-查询服务基础简介
, i9 z& A/ U) _2 x! `1.1.5、黄聪:搜索引擎工作原理-体系结构8 \+ s+ Q* S- {& U A) x; |' \
2.1、黄聪:页面搜集原理、技术和系统-基础知识# C! C- h+ I9 }- U- }
2.2、黄聪:页面搜集原理、技术和系统-搜集过程
2 t* u# L3 p3 F; ?6 j2 E5 k+ t2.3、黄聪:页面搜集原理、技术和系统-天网存储结构定义) `& @* O4 S( J9 T9 d6 \
2.4、黄聪:页面搜集原理、技术和系统-如何避免网页重复搜集
/ N" V u1 {# v2.5、黄聪:页面搜集原理、技术和系统-如何首先搜集重要的网页& I" w ?; V. ~$ r0 m
2.6、黄聪:页面搜集原理、技术和系统-可扩展搜索子系统
6 }" Z" F t3 A6 {; |! f2.6.1、黄聪:可扩展搜索子系统-节点间URL的划分策略
; i( s7 J/ Q! S! ?* L0 E! g2.6.2、黄聪:可扩展搜索子系统-系统的动态可配置性设计& W! f G! _) [& }
3.1、黄聪:搜集信息的预处理-系统结构0 k. \. ^# }% u. G. b8 k) y
3.1.1、黄聪:搜集信息的预处理-索引网页库, W& o& o7 z# ~4 G$ U
3.1.2、黄聪:搜集信息的预处理-中文分词技术, c! T' J$ k4 X5 \ F( I- |
3.1.3、黄聪:搜集信息的预处理-分析页面和建立倒排文件) w. s! U/ U9 \/ i: T
3.2、黄聪:搜集信息的预处理-网页净化和消重6 P9 [) o7 _1 a2 o7 [
3.2.1、黄聪:搜集信息的预处理-净化与数据提取1 h! I; M. Y+ j9 Y" P! V; U
3.2.2、黄聪:搜集信息的预处理-网页消重
2 ]5 f# g0 G O4.1、黄聪:搜集引擎信息查询服务-网页信息检索
: {/ W0 X% u1 U+ u# ?4.2、黄聪:搜集引擎信息查询服务-中文自动摘要# O( g2 F" b9 i0 u6 e$ y! V
4.3、黄聪:搜集引擎信息查询服务-生成搜索结果页8 `& n0 N+ Q# S
4.4、黄聪:搜集引擎信息查询服务-搜索结果页缓存
6 r" {7 w, K6 F) l$ _5.1、黄聪:用户行为分析-用户查询与点击日志
* E4 c; i" i! n3 p- b5.2、黄聪:用户行为分析-查询日志分析
, O2 ^: [3 ^3 R7 E* K9 h5.3、黄聪:用户行为分析-点击日志分析
# {4 R! y- \/ _0 J v1 S( }6.1、黄聪:相关排序-网页权重的计算
7 k0 a2 S4 U9 L: E% Q$ j+ D, Z7 r- A6.2、黄聪:相关排序-网页词项权重的计算0 q+ b: ^0 c6 n
6.3、黄聪:相关排序-链接权值的计算& L; S- M8 C# W2 |$ U
6.4、黄聪:相关排序-用户评价权值的计算
{! e* x* a- V1 g! s ~6.5、黄聪:相关排序-最终权值的计算
7 [9 `2 H5 q9 Y/ N) @3 H7、黄聪:中文网页自动分类技术4 \0 x% \9 `. u. X! F& |
8、黄聪:搜索引擎工作原理总结' @% k% ^6 c4 c, ]/ ^$ C
附1、黄聪:如何在WIN7下使用Virtualbox安装Ubuntu. e1 {- Q; q5 |* g5 H
附2、黄聪:如何搭建TSE搜索引擎
; c% p# X) H6 B( O/ J- U附3、黄聪:如何让TSE搜索引擎重新抓取网页2 R' m5 G- C) z+ @( S$ u& C: V
+ d9 X1 ?9 u9 l- |
下载地址:https://pan.baidu.com/s/1gPW1h
: J d+ _) L9 I1 }3 T |
|