|
|
1.1.1、黄聪:搜索引擎的工作原理-基础要求
& x' X; O, m7 @+ {# S1.1.2、黄聪:搜索引擎工作原理-网页搜索基础简介0 _ h8 m5 D, G" x% h
1.1.3、黄聪:搜索引擎工作原理-预处理基础简介
; v! u e3 E! x0 o% x1.1.4、黄聪:搜索引擎工作原理-查询服务基础简介8 y) E4 b+ j, b1 _( Z
1.1.5、黄聪:搜索引擎工作原理-体系结构
( l- t5 e- s( _, \' @2.1、黄聪:页面搜集原理、技术和系统-基础知识
! F% R# p& B; @0 o' _9 |2.2、黄聪:页面搜集原理、技术和系统-搜集过程7 N: B" c a8 R; } i' _
2.3、黄聪:页面搜集原理、技术和系统-天网存储结构定义* V+ ^) |& `: _# ?- f7 o6 Y9 f
2.4、黄聪:页面搜集原理、技术和系统-如何避免网页重复搜集
0 L/ _3 D6 Y' T0 T) B. {1 ~2.5、黄聪:页面搜集原理、技术和系统-如何首先搜集重要的网页6 [0 o# g! o3 U `+ ]3 Z( V
2.6、黄聪:页面搜集原理、技术和系统-可扩展搜索子系统
" G* s: p# i$ G' [2 c. S5 k2.6.1、黄聪:可扩展搜索子系统-节点间URL的划分策略
% Y) N% p6 z4 Y( _9 Y: k2.6.2、黄聪:可扩展搜索子系统-系统的动态可配置性设计
* a( \! ?5 q: j" J3.1、黄聪:搜集信息的预处理-系统结构: k. e3 Q4 |4 \/ K8 q" `
3.1.1、黄聪:搜集信息的预处理-索引网页库
6 e# ]+ s* }3 M$ L% Z7 l# H3.1.2、黄聪:搜集信息的预处理-中文分词技术/ o- R1 t) H; d6 w& m {8 ^
3.1.3、黄聪:搜集信息的预处理-分析页面和建立倒排文件
. W# X% C( [2 o1 @, n3.2、黄聪:搜集信息的预处理-网页净化和消重. B" a6 A# i n( ^2 d
3.2.1、黄聪:搜集信息的预处理-净化与数据提取
, v) }% K4 `+ P& W( o9 q) o, F. q3.2.2、黄聪:搜集信息的预处理-网页消重
" u: F; w# s1 @1 o9 w- B* {4 Z4.1、黄聪:搜集引擎信息查询服务-网页信息检索. V, s/ K8 `3 X0 G" }9 w+ X
4.2、黄聪:搜集引擎信息查询服务-中文自动摘要
$ @! B3 d0 A/ \+ K0 J6 ^+ x) `% L4.3、黄聪:搜集引擎信息查询服务-生成搜索结果页& d7 J* O9 M* r- V" P, i \" ~$ R
4.4、黄聪:搜集引擎信息查询服务-搜索结果页缓存# r0 N: R* i) ~$ u8 [% O
5.1、黄聪:用户行为分析-用户查询与点击日志
* S9 Y* d Y* e( u# n" _) r5.2、黄聪:用户行为分析-查询日志分析; v+ ~9 F1 |# B; J4 w
5.3、黄聪:用户行为分析-点击日志分析
4 s; z: a3 y; m' @0 S6.1、黄聪:相关排序-网页权重的计算
- m' ]/ _- B$ w! X6.2、黄聪:相关排序-网页词项权重的计算
! \+ Z1 W; v2 k ^' z3 O6.3、黄聪:相关排序-链接权值的计算
# n6 p+ |) c W2 q( M$ W& ~! c6 n9 q3 k; F6.4、黄聪:相关排序-用户评价权值的计算
5 g/ ~6 @+ T: X6.5、黄聪:相关排序-最终权值的计算4 B% W7 t- {5 f- z6 e. ]
7、黄聪:中文网页自动分类技术
- t G) b x9 e1 A0 P+ E# I8、黄聪:搜索引擎工作原理总结
9 r7 c* M, L3 i) B+ C附1、黄聪:如何在WIN7下使用Virtualbox安装Ubuntu
9 s3 ]! p2 t$ X附2、黄聪:如何搭建TSE搜索引擎( n. B* R% b2 \" c
附3、黄聪:如何让TSE搜索引擎重新抓取网页) h4 J0 y. T0 U W
! P: B# {6 ? M/ \% R下载地址:https://pan.baidu.com/s/1gPW1h# p0 w8 y, ~( d7 V* R
|
|