主页 > 科技生活 >通海地震_做一个完整的搜索引擎要学什么编程技术和知识 >

通海地震_做一个完整的搜索引擎要学什么编程技术和知识

做一个完整的搜索引擎要学什么编程技术和知识
TCP/IP协议,HTTP协议,前端编程,服务端编程,网络编程,数据库原理,爬虫,自动机,Tire树,数据挖掘,机器学习,自然语言处理等Java语言,软件开发等。追问

全部可以用来编写搜索引擎程序的语言有哪些
web编程 制作分类搜索引擎


客户端通过浏览器向Web服请求搜索引擎,引擎程序调用中间件进行搜索处理,这索处理包括在本网站上数据库中的搜索和对 Internet上其他服务器的搜索。然后中间件服务器把搜索结果返回给Web服务器上的搜索引擎程序。搜索引擎程序再将数据封装为HTML 或XML返回给客户端的浏览器。
反观现在的个人网站,大多使用的是提供商提供的免费空间,没有 CGI 、没有ASP、没有执行和写入权限、没有数据库,还有的免费空间连1M以上的文件都不让上传(题外话),所以在个人网站上用上面的方法实现关键字搜索引擎是不现实的。我们要实现关键字搜索,就必须找到一种不需服务器端动态脚本和数据库的方法,而且它需要满足以下条件:
1. 数据具有良好的结构性;
2. 有方便的数据访问接口;
3. 有方便的数据查找接口;
4. 能够生成具有良好封装型的HTML。
我们可以通过这样一种解决方案实现以上构想:
图像
客户端通过浏览器请求XML文档和客户端脚本语言,Web服务器像返回HTML一样返回给浏览器XML和客户端脚本,在由浏览器进行计算,得出搜索结果。这样做的优点是不需增加Web服务器的负担;缺点是
XML文档在被计算之前需要完全下载到客户端,假如存储的记录太多,就会在下载上浪费很多时间(熟悉网络程序的人会发现,这实际上继承了分布式网络应用出现之前的结构)。
让我们看一看这种方案的性能:
1.数据的结构性
让我们比较一下传统数据库的表和XML
ID
Name
Phone
1
张三
61111111
2
李四
62222222
3
王五
63333333
我们从右图可以看出:XML文档有媲美数据库的良好文档结构。
图像
2.数据访问接口
在Internet Explorer 中,微软提供了XML文档对象模型(XMLDOM),这样我们可以通过对XML文档对象的操作轻松访问XML
文档,我们以一个存储文章信息的XML文档TECH.XML 为例:
'VBScript
Dim xmldoc
Set xmldoc = CreateObject("Microsoft.XMLDOM")
xmldoc.load "tech.xml"
以上代码段首先创建一个XML文档对象,然后调用其load 方法从TECH.XML 装载XML
文档
3.数据查找接口
'VBScript
Set objNodeList = xmldoc.getElementsByTagName("title")
Set objdiscList = xmldoc.getElementsByTagName("discribe")
Set objhrefList = xmldoc.getElementsByTagName("href")
这三行代码分别从XML文档对象中查找出标签为"title"、"discribe"、"href" 的元素,存放到XMLDOM提供的NodeList (节点列表)对象中。
4.数据的封装型
由于IE 和Netscape支持XML。所以可以直接显示XML,也可以在脚本程序中使用微软提供的文档对象模型(DOM)写出一定格式。
完整代码见下:
search.htm



搜索



Cyber Class网站文章检索


Input the keyword:








这方面的免费源码,在网上 多得很啊追问

能给个链接不?谢啦
搜索引擎是通过什么编程语言得以实现的?


c语言程序?追问

{ }这个在C语言编程中是什么意思?不耻下问。望回复谢谢了。追答

QT 65858

自己去学!
请问一下怎么写搜索引擎,使用java编程语言,是搜索文件的搜索引擎,不是文件的搜索引擎,感激不尽


谈谈我的看法,并不是具体如何去编程,仅仅是思路而已
1\建立一型的数据库,然后个系统服务,每隔一段时间就自动运行一次,搜索全盘文件系统的文件结构,并做索引记录
2\你要进行搜索的时候,直接数据库查询就行

思路来源:Linux系统的updatedb,然后locate  查找文件的机制。你可以百度一下。追问

能告诉我一下代码怎么写,或者哪里有获取代码的网站追答

很抱歉,我不懂java,我平时没有接触过java
我感觉编程最重要的是有思路,
我平时学习linux的时候,了解他的locate查找文件的机制后,感觉速度很快,所以才给你提出了这个思路,当然还有 linux下find查找机制,这个是的确的文件查找机制,你下命令之后就开始去全盘搜索文件,速度很慢。远远不如locate快。
至于代码,我会c#,vb的,其他我不懂。追问

谢谢你,能告诉我哪里有Java源代码的网站吗?如果答得好,我也会采纳的,谢谢你帮助追答

你能够问这样问题,说明你有Java编程的基础吧,只要有了思路,自己写就行了,
如果你想找个网站,把源代码复制到自己工程,对于你来说真的没有什么提高!
我不会java!sorry


上一篇: 下一篇: