M2终审报告

团队成员简介

  

  左边:马腾跃 右边:陈谋

  

  左上:李剑锋  左下:仉伯龙 右:卢惠明

团队成员及博客:

    李剑锋:        Blog:      http://www.cnblogs.com/Power-Byte/

    陈谋:            Blog:        http://www.cnblogs.com/13061176Terry/

    马腾跃:         Blog:        http://www.cnblogs.com/summerMTY/

    卢惠民:         Blog:        http://www.cnblogs.com/lhm924/

    仉伯龙:         Blog:        http://www.cnblogs.com/zhangbolong/

项目目标:

    在线问答网站中散落着许多有价值的知识和有借鉴意义的经验,然而对于一个不精通于信息检索的人来说要寻找这些有价值的信息往往要耗费大量时间,甚至根本不能找到,故而本软件在此需求的基础上进行开发,以满足用户对于信息检索,信息筛选,信息翻译,信息可视化等方面的需求。

预期的典型用户:

    •   软件的用户方一方面是学霸在线教学问答系统后台的开发人员,开发人员可以通过软件提供的接口来直接对于数据进行处理,开发人员具有专业计算机水平,
    •   软件的用户方另一方面是普通用户,本软件将功能性的模块进行集成与封装并且提供UI接口服务于普通用户对于信息检索,信息筛选,信息翻译,信息可视化等方面的需求。

预期的功能描述:

    • 软件产品功能主要包括定义在线教学问答网站的内容结构,能够从爬到的内容中抽取元数据并将其纳入到既定的组织结构中,在用户查询时能够给予快速准确的响应,并且支持标签,翻译的功能。

      • 在线问答网站的内容结构定义;

          主要是对在线问答网站的组织进行格式化提取,(包括网站的用户提出的问题,以及其他用户给出的相应的解决方式),然后按照既定的格式整理并且存储到数据库中。

      • 增量式的数据处理;

          对于后续爬取得到的最新数据,能够按照定义好的内容结构准确地合并到已有的内容中。

      • 文本标签;

          对于用户提出的问题所属的类别使用标签进行分类。

      • 文本关键词提取;

          对于问题中所涉及的主要内容以及术语进行分类提取。

      • 文本内容翻译;

          满足基于不同语言背景的用户搜集检索资料的需求。

      • 用户界面与用户进行交互。

          满足界面友好的要求,对于用户来说易于上手,易于使用。

      • 给在线组和app手机客户端组上传数据

          当有需求的时候,我们会给在线组上传一定量的数据,由于给网站上传大量数据的时候会给网站服务器增加负担,有时网站拒绝访问,有时网站崩溃,所以每次我们只上传一定量的数据,从而让上传数据变得稳定。

预期用户

    • 由于我们的应用是给学霸客户端和在线系统使用,所以的目标就是给他们定时提供数据。

团队成员在M1 的角色和具体贡献:


名字


角色


具体的可衡量的可验证的贡献


陈谋


PM & Dev


写了10篇博客,多次和爬虫组、客户端、在线系统进行沟通,写了 3213行代码


李剑锋


Dev & Test


写了523行代码,  200行注释, 1篇博客


卢惠明


Dev & Test


完成关键词抽取,写了495行代码,并完成相应的测试,2篇博客


仉伯龙


Dev & Test


测试了关键词抽取代码,写了235行代码,测试其结果等


刘夕霆


Dev & Test


与android客户端组进行沟通,写了276行代码,测试最终版本


马腾跃


Dev & Test


写了276行代码,与在线组进行沟通、交流

成果展示

  • 登陆界面

  • 主界面:

    

  • 添加文本:

  • 原始数据:

  • 去噪:

  • 分词:

  • 翻译原文本:(API)

  • 翻译译文:

  • 中英对照:

  • 最终结果:

  • 上传数据
  •  

软件Bug:

    •   之前的软件的一个缺点是代码冗余度较大,功能代码和界面耦合较为紧密(主界面代码长度为1000+)在本软件中将主要功能与界面分离出来,做到松耦合。

燃尽图:

    •   个人总结:  现阶段的追踪进度方面存在一些小问题。
    •   一旦数据库关闭,我们的程序存在不能继续访问的问题。
    •   数据加载进度慢,没能够快速处理文本文件。
  1. 李剑锋:在Alpha阶段我们完成了既定的目标,但是可能对于团队中所遇到的问题难度估计不够,遇到一个个看似简单的问题往往需要耗费相当多的时间,以这一方面在Beta需要作出更大的改变。
  2. 陈谋:这一次我们组的团队协作方面做得不够好,主要开发是由我来做,所以收获也是最大的。首先我对于对于工程的把握更加明确。学会了数据的与处理的工作,当然也在阅读代码的过程中明确翻译、关键词抽取等数据处理方面的知识。
  3. 卢惠明:完成了关键词抽取之后,不敢说我对于数据处理的一个重要方面有了没明确认识,但是至少可以说我已经可以在学校智能所做些事情了。
  4. 刘夕霆:对于网站的一些知识,我已经有了较高的认识。特别是对于问答网站的一些处理方面,对于网页规格方面也有了较高的认识。
  5. 仉伯龙:我处理不少事情,但是我感觉学的不是特别多。我相信只要我们不断进取,不断探索,我一定能够学到更多,明白更多,最后在理论知识、实践知识方面有了更高的认识。
  6. 潘成鼎:我由于中途有些事没能够参与到系统的开发,所以我只能说声抱歉。如果下阶段我还能在这一组,我一定要为团队做出必要的贡献。

  我们在这阶段开始时对于数据处理的认识不是特别明确,所以开始时候我们没有进行良好的技术分工。进度较为缓慢。所以在Beta阶段,将由陈谋作为PM,对团队任务进行细分,对需求进行明确,对架构进行规划。最后交给每一位组员明确的任务,从而让每一个组员有较高的提升。

时间: 2024-04-02 08:23:18

M2终审报告的相关文章

M2 终审

1.团队成员简介 左边:马腾跃 右边:陈谋 左上:李剑锋  左下:仉伯龙 右:卢惠明 团队成员及博客: 李剑锋:        Blog:      http://www.cnblogs.com/Power-Byte/ 陈谋:            Blog:        http://www.cnblogs.com/13061176Terry/ 马腾跃:         Blog:        http://www.cnblogs.com/summerMTY/ 卢惠民:         B

M2终审

1.团队成员简介 左边:马腾跃 右边:陈谋 左上:李剑锋  左下:仉伯龙 右:卢惠明 团队成员及博客: 李剑锋:        Blog:      http://www.cnblogs.com/Power-Byte/ 陈谋:            Blog:        http://www.cnblogs.com/13061176Terry/ 马腾跃:         Blog:        http://www.cnblogs.com/summerMTY/ 卢惠民:         B

终审报告

团队成员简介: 左边:马腾跃 右边:陈谋 左上:李剑锋  左下:仉伯龙 右:卢惠明 团队成员及博客: 李剑锋:        Blog:      http://www.cnblogs.com/Power-Byte/ 陈谋:            Blog:        http://www.cnblogs.com/13061176Terry/ 马腾跃:         Blog:        http://www.cnblogs.com/summerMTY/ 卢惠民:         Bl

百科知识 学位论文学术不端行为检测系统简介

学位论文学术不端行为检测系统 研制介绍与使用方法 第一章 系统简介 1.1 系统概述 学位论文学术不端行为检测系统(简称"TMLC")以<中国学术文献网络出版总库>为全文比对数据库,实现了对抄袭与剽窃.伪造.篡改等学术不端行为的快速检测,可供用户检测学位论文,并支持用户自建比对库.其系统示意图如图1所示. 图1 检测系统示意图 1.2 系统技术路线介绍 TMLC 采用CNKI 自主研发的自适应多阶指纹(AMLFP)特征检测技术,具有检测速度快,准确率,召回率较高,抗干扰性强

sixsix团队“餐站”应用M2阶段发布报告》待续

一.新功能 客户端 搜索功能 菜品图片加载 图片控件点击 意见反馈 微信分享 清除缓存 友盟统计 爬虫段 算法优化>爬取效率增加 自动爬取数据 服务端 接收保存并处理反馈的意见 单元测试功能 二.修复的缺陷 客户端 无法退出的bug 内容不正确的bug 界面卡顿优化 爬虫端 减少数据冗余 服务端 自动爬取数据

爱奇艺、优酷、腾讯视频竞品分析报告2016(一)

1 背景 1.1 行业背景 1.1.1 移动端网民规模过半,使用时长份额超PC端 2016年1月22日,中国互联网络信息中心 (CNNIC)发布第37次<中国互联网络发展状况统计报告>,报告显示,网民的上网设备正在向手机端集中,手机成为拉动网民规模增长的主要因素.截至2015年12月,我国手机网民规模达6.20亿,有90.1%的网民通过手机上网. 图 1  2013Q1~2015Q3在线视频移动端和PC端有效使用时长份额对比 根据艾瑞网民行为监测系统iUserTracker及mUserTrac

2017全国两会政府工作报告(全文)

2017全国两会政府工作报告(全文) "两会"并不是一个特定的机构名称,而是对自1959年以来历年召开的"中华人民共和国全国人民代表大会"和"中国人民政治协商会议"的统称.由于两场会议会期基本重合,而且对于国家运作的重要程度都非常的高,故简称做"两会".下面一起来阅读2017年政府两会工作报告! 2017年两会政府工作报告 --2017年3月5日在第十二届全国人民代表大会第五次会议上 国务院总理 李克强 各位代表,现在,我代表

中华英才网竞品分析报告2016

中华英才网竞品分析报告 1 背景 1.1 行业背景 1) 网民增速不断提升,移动端网民规模过半. 2016年1月22日,中国互联网络信息中心 (CNNIC)发布第37次<中国互联网络发展状况统计报告>.截至2015年12月,中国网民规模达6.88亿, 半数中国人已接入互联网. 其中,2015年新增网民3951万人,增长率为6.1%,较2014年提升1.1个百分点,网民规模增速有所提升. 图 1  2011-2018年中国整体网民数量及增长趋势 <报告>同时显示,网民的上网设备正在向

十八大报告指出,要到2020年实现国内生产总值和城乡居民人均收入比2010年翻一

狄仁杰:十八大报告指出,要到2020年实现国内生产总值和城乡居民人均收入比2010年翻一番,元芳,你怎么看?李元芳:大人,卑职以为-. 首先,GDP比2010年翻一番不是新提法,十六大报告就曾指出"在优化结构和提高效益的基础上,国内生产总值到二0二0年力争比二000年翻两番",十七大报告也如此着墨:"在优化结构.提高效益.降低消耗.保护环境的基础上,实现人均国内生产总值到二0二0年比二000年翻两番."但对比下2000年.2010年GDP数据不难发现,实际上2010