RSS订阅 | 匿名投稿
您的位置:网站首页 > 服务支持 > 正文

Python中使用Flask、MongoDB搭建简易图片服务器

作者:habao 来源: 日期:2015/9/22 19:55:28 人气: 标签:图片服务器搭建

  上传文件之后, upload 函数会跳转到对应的文件浏览页. 这样一来, 文本文件内容就可以正常预览了, 如果不是那么挑剔换行符跟连续空格都被浏览器吃掉的话.

  2.4 当找不到文件时

  有两种情况, 其一, 数据库 ID 格式就不对, 这时 pymongo 会抛异常validId ; 其二, 找不到对象 (!), 这时 pymongo 会返回 None .

  简单起见就这样处理了

  然后试试上传文本文件肯定虚, 传图片文件才能正常进行. 不对, 也不正常, 因为传完跳转之后, 服务器并没有给出正确的 mimetype, 所以仍然以预览文本的方式预览了一坨二进制乱码.

  要解决这个问题, 得把 MIME 一并存到数据库里面去; 并且, 在给出文件时也正确地传输 mimetype

  当然这样的话原来存进去的东西可没有 mime 这个属性, 所以最好先去 mongo shell 用 db.files.drop() 清掉原来的数据.

  2.6 根据上传时间给出 NOT MODIFIED

  利用 HTTP 304 NOT MODIFIED 可以尽可能压榨与利用浏览器缓存和节省带宽. 这需要三个操作

  1)、记录文件最后上传的时间

  2)、当浏览器请求这个文件时, 向请求头里塞一个时间戳字符串

  3)、当浏览器请求文件时, 从请求头中尝试获取这个时间戳, 如果与文件的时间戳一致, 就直接 304

  体现为代码是

  然后, 得弄个脚本把数据库里面已经有的图片给加上时间戳.

  顺带吐个槽, 其实 NoSQL DB 在这种下根本体现不出任何优势, 用起来跟 RDB 几乎没两样.

  2.7 利用 SHA-1 排重

  与冰箱里的可乐不同, 大部分情况下你肯定不希望数据库里面出现一大波完全一样的图片. 图片, 连同其 EXIFF 之类的数据信息, 在数据库中应该是惟一的, 这时使用略强一点的散列技术来检测是再合适不过了.

  达到这个目的最简单的就是建立一个 SHA-1 惟一索引, 这样数据库就会相同的东西被放进去.

  在 MongoDB 中表中建立惟一 索引 , 执行 (Mongo 控制台中)

  db.files.ensureIndex({sha1: 1}, {unique: true})

  如果你的库中有多条记录的话, MongoDB 会给报个错. 这看起来很和谐无害的索引操作被告知数据库中有重复的取值 null (实际上目前数据库里已有的条目根本没有这个属性). 与一般的 RDB 不同的是, MongoDB null, 或不存在的属性值也是一种相同的属性值, 所以这些幽灵属性会导致惟一索引无法建立.

  解决方案有三个:

  1)删掉现在所有的数据 (一定是测试数据库才用这种不负责任的方式吧!)

  2)建立一个 sparse 索引, 这个索引不要求幽灵属性惟一, 不过出现多个 null 值还是会判定重复 (不管现有数据的话可以这么搞)

  3)写个脚本跑一次数据库, 把所有已经存入的数据翻出来, 重新计算 SHA-1, 再存进去

  具体做法随意. 假定现在这个问题已经搞定了, 索引也弄好了, 那么剩是 Python 代码的事情了.

  在上传文件这一环就没问题了. 不过, 按照这个逻辑, 如果上传了一个已经存在的文件, 返回 c[_id] 将会是一个不存在的数据 ID. 修正这个问题, 最好是返回 sha1 , 另外, 在访问文件时, 相应地修改为用文件 SHA-1 访问, 而不是用 ID.

  最后修改的结果及本篇完整源代码如下 :

读完这篇文章后,您心情如何?
0
0
0
0
0
0
0
0
本文网址: