荔园在线

荔园之美,在春之萌芽,在夏之绽放,在秋之收获,在冬之沉淀

[回到开始] [上一篇][下一篇]


发信人: PhilCF (起床.挂站.TSG.下站.睡觉), 信区: NetResource
标  题: 毕业论文四、f支持多媒体文件的特别处理技术[ZZ]
发信站: 荔园晨风BBS站 (Tue Jun 25 19:12:09 2002), 转信

发信人: chenhua (陈华), 信区: FtpSearch
标  题: 毕业论文四、f)支持多媒体文件的特别处理技术
发信站: 天网搜索论坛 (Wed May 29 22:35:53 2002)

f)      支持多媒体文件的特别处理技术


i.      多媒体文件条目的文件名特殊性以及查询特殊性

    多媒体文件,比如视频和音频文件,都有一个典型特征就是大量文件的文件名并不
是确定该文件内容的字串。比如视频文件的文件名可能是a.rm b.rm 而不是具体 电影
名.rm,或者文件名使用的是英文而不是翻译过来的中文,这样对于用户而言,就很难
找到他(她)所需要的文件。对于音乐,一方面可能文件以歌名为文件名而不是以歌手
的名字为文件名,但对于用户查询而言可能两个都是需要的,另一方面与电影文件名类
似,就是cd盘改录的音频可能使用track0.mp3 track1.mp3等等名字,而这个名字根本
无法确定音乐的内容。


ii.     一种比较有效的处理技术

    解决这个问题的办法是利用ftp站点目录的分类能力,一般而言,目录名说明了这
个目录的内容,如果我们把多媒体文件的目录名与文件名一起去匹配查询串,则上述问
题就可以轻易解决。在我们设计的搜索引擎里,我们将具有音频和视频类型的文件条目
的文件名与其上一层目录名合并。比如电影“罗马假日/1.rm”,“罗马假日/2.rm”。
这样,当用户查询“罗马假日”的时候就能得到其想要的下载地址,并且,由于使用了
类型过滤,用户可以精确的只找到“罗马假日”的电影格式文件,而不是它里面的主题
曲或者介绍文本。


iii.    在建库模块的改动

    由于采用了上述技术,必须对ftp搜索引擎里的建库模块和CGI做些改动。在建库模
块,必须把多媒体文件的文件名和其上一层目录合并一起建索引,否则查询时就无法得
到正确结果。同时,在索引库的Display库里,直接用上一层目录名/文件名的格式代替
文件名保存。


iv.     在CGI模块的改动

    在CGI中,由于搜索时已经采用了对多媒体文件的文件名和上层目录名合并技术,
因而在结果显示的时候不能只显示文件名。比如用户查询“罗马假日”却只给出“1.
rm”、“2.rm”作为结果,显然会使得用户不知所以,以为系统出错,因而在结果显示
的时候,也得把上一层目录名/文件名 格式显示给用户,同时也要保证下载地址的正确
性。








                                图【8】快捷方式逻辑图


iii.    文件分类类别层次的显示

    通过查询数据库,得到快捷方式的两层分类。CGI用限制显示行宽的格式显示顶层
快捷方式分类及它的子类。每个分类链接到文件分类条目显示CGI上。

比如:

·程序下载
  系统办公、 网络聊天、 媒体图象、 驱动压缩、
  专业软件、 桌面布景、 电脑游戏、 病毒与安全、

    为了使得分类层次显示页面的灵活性,我们采用了页面模板技术,CGI读取模板
<wwwroot>\index_src.htm,将其中的特定标注<!—index--> 替换为分类层次。另一方
面,考虑分类层次是基本上不会改变的,直接把CGI的显示页面保存成静态html文件,
作为ftp搜索引擎的首页。


iv.     快捷方式条目的显示

    快捷方式条目的显示使用了ftp搜索引擎结果页面模板,页面上结果中查询的表单
变成了注册新软件的表单,查询结果区域显示该分类的快捷方式条目,每一行显示四个
快捷方式和它们的点击计数,每页显示80个快捷方式条目。

快捷方式条目的显示如图10:




                        图【10】 快捷方式条目显示图


v.      注册新的软件

    在快捷方式条目显示页面上方有一个注册新软件的表单,该表单显示该页面的快捷
方式分类类别,并可以输入软件名立即注册。快捷方式注册程序注册完后马上转向到
ftp搜索引擎的搜索CGI显示查询的结果。
    另外,我们对注册新软件的查询项做了些特别的处理。如果注册的类别是快捷方式
电影分类下的子类,则查询时增加文件类型为视频的过滤,而音乐的对应音频文件类型
,图片的对应图象文件类型,开发文档的对应文档文件类型。这样就使得在特定分类的
快捷方式里只能找到该类别的文件,比如在电影类别的快捷方式下只能看到视频类型的
文件查询结果。


vi.     过滤用户注册的快捷方式

    由于用户的注册有很大的随机性,不可能把用户注册的软件的快捷方式直接显示给
其他用户使用。因而所有注册的快捷方式条目都必须经过手工的过滤或者修改。过滤修
改的标准是快捷方式的分类是否正确,查询是否足够精确,以及是否已经有类似的快捷
方式,英文条目的首字母是否大写等等。


vii.    管理快捷方式系统

    由于有部分快捷方式查询结果可能在下一次建库后就再也查不到结果,因而必须对
快捷方式进行管理,同时也对一些快捷方式分类错误进行改动。定期的管理使得快捷方
式更为精干,同时也消除了错误。


--

※ 来源:.天网搜索论坛 http://binglebbs.dhs.org[FROM: 162.105.80.74]

--

      WELCOME TO PC's Home  HTTP://192.168.48.84

※ 来源:·荔园晨风BBS站 bbs.szu.edu.cn·[FROM: 192.168.48.84]


[回到开始] [上一篇][下一篇]

荔园在线首页 友情链接:深圳大学 深大招生 荔园晨风BBS S-Term软件 网络书店