百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

NodeJs 实战——原生 NodeJS 轻仿 Express 框架从需求到实现

ccwgpt 2024-09-29 09:48 23 浏览 0 评论

确认需求

  • 将路由与应用分离,便于代码的维护和功能拓展
  • 优化路由模块,提升匹配效率

Router 与 Application 分离

为了将路由与应用分离,这里我们新增一个 Router.js 文件,用来封装一个路由管理的类 Router,代码如下。

// 路由管理类
function Application() {
 // 用来保存路由的数组
 this.stack = [
 {
 path: '*',
 method: '*',
 handle: function(req, res) {
 res.writeHead(200, {
 'Content-Type': 'text/plain'
 });
 res.end('404');
 }
 }
 ];
}
Router.prototype.get = function(path, handle) {
 // 将请求路由压入栈内
 this.stack.push({
 path,
 method: 'GET',
 handle
 });
};
Router.prototype.handle = function() {
 // 循环请求过来放入router数组的对象,当请求方法和路劲与对象一致时,执行回调handler方法
 for (var i = 1, len = this.stack.length; i < len; i++) {
 if (
 (req.url === this.stack[i].path || this.stack[i].path === '*') &&
 (req.method === this.stack[i].method || this.stack[i].method === '*')
 ) {
 return this.stack[i].handle && this.stack[i].handle(req, res);
 }
 }
 return this.stack[0].handle && this.stack[0].handle(req, res);
};

修改原有的 application.js 文件内容

var Router = require('./router');
var http = require('http');
function Application() {}
Application.prototype = {
 router: new Router(),
 get: function(path, fn) {
 return this.stack.get(path, fn);
 },
 listen: function(port, cb) {
 var self = this;
 var server = http.createServer(function(req, res) {
 if (!res.send) {
 res.send = function(body) {
 res.writeHead(200, {
 'Content-Type': 'text/plain'
 });
 res.end(body);
 };
 }
 return self.router.handle(req, res);
 });
 return server.listen.apply(server, arguments);
 }
};
exports = module.exports = Application;

经过上面的修改,路由方面的操作只会与 Router 类本身有关,达到了与 Application 分离的目的,代码结构更加清晰,便于后续功能的拓展。

优化路由模块,提升匹配效率

经过上面的实现,路由系统已经可以正常运行了。但是我们深入分析一下,可以发现我们的路由匹配实现是会存在性能问题的,当路由不断增多时,this.stack 数组会不断的增大,匹配的效率会不断降低,为了解决匹配的效率问题,需要仔细分析路由的组成部分。 可以看出,一个路由是由:路径(path)、请求方式(method)和处理函数(handle)组成的。path 和 method 的关系并不是简单的一对一的关系,而是一对多的关系。如下图,所示,对于同一个请求链接,按照RestFul API 规范 可以实现如下类似的功能。

基于此,我们可以将路由按照路径来分组,分组后,匹配的效率可以显著提升。对此,我们引入层(Layer)的概念。 这里将 Router 系统中的 this.stack 数组的 每一项,代表一个 Layer。每个 Layer 内部含有三个变量。

  • path,表示路由的请求路径
  • handle,代表路由的处理函数(只匹配路径,请求路径一致时的处理函数)
  • route,代表真正的路由,包括 method 和 handle 整体结构如下图所示
--------------------------------------
| 0 | 1 |
--------------------------------------
| Layer | Layer |
| |- path | |- path |
| |- handle | |- handle |
| |- route | |- route |
| |- method | |- method |
| |- handle | |- method |
--------------------------------------
 router 内部

创建Layer类,匹配path

function Layer(path, fn) {
 this.handle = fn;
 this.name = fn.name || '<anonumous>';
 this.path = path;
}
/**
 * Handle the request for the layer.
 *
 * @param {Request} req
 * @param {Response} res
 */
Layer.prototype.handle_request = function(req, res) {
 var fn = this.handle;
 if (fn) {
 fn(req, res);
 }
};
/**
 * Check if this route matches `path`
 *
 * @param {String} path
 * @return {Boolean}
 */
Layer.prototype.match = function(path) {
 if (path === this.path || path === '*') {
 return true;
 }
 return false;
};
module.exports = Layer;

修改 Router 类,让路由经过 Layer 层包装

var Layer = require('./layer');
// 路由管理类
function Router() {
 // 用来保存路由的数组
 this.stack = [
 new Layer('*', function(req, res) {
 res.writeHead(200, {
 'Content-Type': 'text/plain'
 });
 res.end('404');
 })
 ];
}
Router.prototype.get = function(path, handle) {
 // 将请求路由压入栈内
 this.stack.push(new Layer(path, handle));
};
Router.prototype.handle = function(req, res) {
 var self = this;
 for (var i = 1, len = self.stack.length; i < len; i++) {
 if (self.stack[i].match(req.url)) {
 return self.stack[i].handle_request(req, res);
 }
 }
 return self.stack[0].handle_request(req, res);
};
module.exports = Router;

创建Route类,匹配method

创建Route类,该类主要是在Layer层中匹配请求方式(method),执行对应的回调函数。这里只实现了get请求方式,后续版本会对这一块进行扩展。

var Layer = require('./layer');
function Route (path) {
 this.path = path;
 this.stack = []; // 用于记录相同路径不同method的路由
 this.methods = {}; // 用于记录是否存在该请求方式
}
/**
 * Determine if the route handles a given method.
 * @private
 */
Route.prototype._handles_method = function (method) {
 var name = method.toLowerCase();
 return Boolean(this.methods[name]);
}
// 这里只实现了get方法
Route.prototype.get = function (fn) {
 var layer = new Layer('/', fn);
 layer.method = 'get';
 this.methods['get'] = true;
 this.stack.push(layer);
 return this;
}
Route.prototype.dispatch = function(req, res) {
 var self = this,
 method = req.method.toLowerCase();
 
 for(var i = 0, len = self.stack.length; i < len; i++) {
 if(method === self.stack[i].method) {
 return self.stack[i].handle_request(req, res);
 }
 }
}
module.exports = Route;

修改Router类,将route集成其中。

var Layer = require('./layer');
var Route = require('./route');
// 路由管理类
function Router() {
 // 用来保存路由的数组
 this.stack = [
 new Layer('*', function(req, res) {
 res.writeHead(200, {
 'Content-Type': 'text/plain'
 });
 res.end('404');
 })
 ];
}
Router.prototype.get = function(path, handle) {
 var route = this.route(path);
 route.get(handle);
 return this;
};
Router.prototype.route = function route(path) {
 var route = new Route(path);
 var layer = new Layer(path, function(req, res) {
 route.dispatch(req, res);
 });
 layer.route = route;
 this.stack.push(layer);
 return route;
};
Router.prototype.handle = function(req, res) {
 var self = this,
 method = req.method;
 for (var i = 1, len = self.stack.length; i < len; i++) {
 if (self.stack[i].match(req.url) && self.stack[i].route && self.stack[i].route._handles_method(method)) {
 return self.stack[i].handle_request(req, res);
 }
 }
 return self.stack[0].handle_request(req, res);
};
module.exports = Router;

总结

我们这里主要是创建了一个完整的路由系统,并在原始代码基础上引入了Layer和Route两个概念。 目录结构如下

express
 |
 |-- lib
 | | 
 | |-- express.js //负责实例化application对象
 | |-- application.js //包裹app层
 | |-- router
 | |
 | |-- index.js //Router类
 | |-- layer.js //Layer类
 | |-- route.js //Route类
 |
 |-- test
 | |
 | |-- index.js #测试用例
 |
 |-- index.js //框架入口

application代表一个应用程序,express负责实例化application对象。Router代表路由组件,负责应用程序的整个路由系统。组件内部由一个Layer数组构成,每个Layer代表一组路径相同的路由信息,具体信息存储在Route内部,每个Route内部也是Layer对象,但是Route内部的Layer和Router内部的Layer是存在一定的差异性。

  • Router内部的Layer,主要包含path、route属性
  • Route内部的Layer,主要包含method、handle属性 当发起一个请求时,会先扫描router内部的每一层,而处理每层的时候会先对比URI,相同则扫描route的每一项,匹配成功则返回具体的信息,没有任何匹配则返回未找到。

相关推荐

想快速上手Python网络爬虫?这份实战指南你不能错过!

以下是关于Python网络爬虫实战的详细指南,涵盖基础知识、常用工具、实战案例及注意事项:一、爬虫基础概念1.什么是网络爬虫?o通过自动化程序从网页上抓取并提取数据的工具。o核心步骤:请求网...

python爬虫怎么副业接单

其实这个问题也挺重要的,花了时间花了经历去学了python爬虫,本想靠着这个技能去补贴家用或者挣点零花钱,但是发现有时候的单子是自己力所不能及的,有的东西真的是不会,又或者不知从何下手。那么这篇文章主...

用Python写了一个图像文字识别OCR工具

人生苦短,快学Python!在之前的文章里,我们多次尝试用Python实现文本OCR识别!今天我们要搞一个升级版:直接写一个图像文字识别OCR工具!引言最近在技术交流群里聊到一个关于图像文字识别的...

taskPyro:为 Python 任务与爬虫插上自动化翅膀的开源利器

在数据驱动的时代,无论是数据采集、ETL流程,还是定期的系统维护脚本,高效、可靠的任务调度成为了许多开发者和运维人员的刚需。特别是对于Python开发者而言,如何优雅地管理和调度日益增多的爬虫任...

网络爬虫:Python动态网页爬虫2种技术方式及示例

作者:糖甜甜甜https://mp.weixin.qq.com/s/5Dwh5cbfjpDfm_FRcpw1Ug这一讲,我将会为大家讲解稍微复杂一点的爬虫,即动态网页的爬虫。动态网页技术介绍动态网页爬...

30个小时搞定Python网络爬虫(全套详细版)

【课程介绍】适用人群1、零基础对Python网络爬虫感兴趣的学员2、想从事Python网络爬虫工程师相关工作的学员3、想学习Python网络爬虫作为技术储备的学员课程目标1、本课程的目标是将大家培养成...

python爬虫常用工具库总结

说起爬虫,大家可能第一时间想到的是python,今天就简单为大家介绍下pyhton常用的一些库。请求库:实现基础Http操作urllib:python内置基本库,实现了一系列用于操作url的功能。...

玛森:Python爬虫书籍推荐

  Python爬虫书籍推荐什么?玛森科技徐老师介绍,网络爬虫现在很火,不管业内人士或业外人士,大家对爬虫或多或少都有一些了解,网络爬虫通俗的讲,就是通过程序去互联网上面爬取想要的内容,并且爬取的过程...

如何入门python爬虫?

1.很多人一上来就要爬虫,其实没有弄明白要用爬虫做什么,最后学完了却用不上。大多数人其实是不需要去学习爬虫的,因为工作所在的公司里有自己的数据库,里面就有数据来帮助你完成业务分析。什么时候要用到爬虫呢...

爬虫修炼手册,Python爬虫学习入门Scrapy

爬虫就如同江湖中的神秘侠客,应运而生,成为了我们获取数据的得力助手。爬虫,正式名称是网络爬虫(WebCrawler),也被叫做网页蜘蛛、网络机器人,它是一段神奇的计算机代码,能够自动在互联网的信息...

如何入门 Python 爬虫?

1.很多人一上来就要爬虫,其实没有弄明白要用爬虫做什么,最后学完了却用不上。大多数人其实是不需要去学习爬虫的,因为工作所在的公司里有自己的数据库,里面就有数据来帮助你完成业务分析。什么时候要用到爬虫呢...

有了这4张思维导图,带你Python(爬虫)轻松入门

刚接触Python爬虫,该怎么学更有效?指南君给大家带来了这四张思维导图。非常适合刚开始学Python爬虫的同学用于回顾知识点、巩固学习情况等。话不多说,快来学习Python爬虫入门的最强干货吧!P...

python爬虫教程之爬取当当网 Top 500 本五星好评书籍

我们使用requests和re来写一个爬虫作为一个爱看书的你(说的跟真的似的)怎么能发现好书呢?所以我们爬取当当网的前500本好五星评书籍怎么样?ok接下来就是学习python的正确姿...

超实用!Python 在爬虫和自动化领域的 8 类工具与技术大盘点

Python在爬虫和自动化领域拥有丰富的工具库和框架,以下是一些常用工具和技术的分类整理,帮助你高效实现数据抓取和自动化任务:1.基础HTTP请求库oRequestso简洁的HTTP库...

学习Python的第四天之网络爬虫

30岁程序员学习Python的第四天之网络爬虫的Scrapy库Scrapy库的基本信息Scrapy库的安装在windows系统中通过管理员权限打开cmd。运行pipinstallscrapy即可安...

取消回复欢迎 发表评论: