010-68815806

330809108

大学生

我来自德国,我参加CMU计算机科研

       秉持尊重学生和家长隐私的原则,以下所展示的图片,已经去掉涉及知识产权的信息。
 
       还有N多学术素材,由于知识产权或家长原因,不便公开,敬请理解。
 
       学生MY是德国留学的大学生,祖籍浙江。学生学习计算机专业,成绩优异,精通德语和英语,希望德国大学毕业后去美国深造攻读计算机博士。
 
       为此,希望参加卡梅大学的科研项目,最开始学生DIY申请,没有获得面试机会。孩子和孩子爸爸,着急错失科研机会,找到了美国名校科研组的老师,经过我们的协调与沟通,向大学申请面试机会,孩子获得了面试机会,并且通过了科研选拔的面试,拿到了CMU科研录取确认信。
 
       学生抵达CMU后,积极努力学习,赢得了老师的认可,获得了3周的延长,一共参加了7周的科研,受益良多。
 
       学生平时熟练运用计算机语言进行程序编写,文字表达能力有所限制,下文是学生所写,1-2周用英文进行的描述;3-7周由于科研任务加大,学生用中文进行的描述。这些朴素的文字,反馈出了学生实际的科研体验与收获,真实、自然,供其他学生和家长参考。
 
 
第一周:
 
       In the beginning, Professor F and I did a brainstorming to raised hypotheses for my project. We thought out totally about 20 hypotheses like “When watching travel journals, the audience tends to skip over the long clips(more than about 10s) where there are no background narrations.”,  “The snippets with the monologue of the vlogger usually have the highest user engagement” and so on.
 
       起初,F教授和我做了头脑风暴,为我的项目提出了假设。我们完全考虑了大约20个假设,例如“在观看旅行期刊时,观众倾向于跳过没有背景叙述的长片段(超过10秒)。”,“与vlogger独白的片段通常都有最高的用户参与度“等等。
 
 
       After that, we tried to narrow all hypotheses down to a list with limited ideas, which could direct us to develop the software, like “design a software that helps vloggers(those YouTubers) create more attractive Vlogs“. However, at this point, we found that it would be really difficult to verify our thoughts since a popular video usually had more than one reason to be appealing. Some Vlogs had tons of views just because of its renowned uploader. Others were popular because it conformed with the current online hotspots and therefore capture audience engagement. Also, there were videos having factitious promotion behind them. Without a full access to that information, almost nobody could have, we would fail to build a model to achieve our design.
 
       在那之后,我们试图将所有假设缩小到一个思路有限的列表,这可能指导我们开发软件,比如“设计一个帮助vlogger(那些YouTubers)创建更有吸引力的Vlogs的软件”。然而,在这一点上,我们发现要验证我们的想法真的很难,因为一个流行的视频通常有多个理由吸引人。一些Vlogs因为其着名的上传者而拥有大量的观点。其他人很受欢迎,因为它符合当前的在线热点,因此吸引了观众参与。此外,还有视频背后的人为推广。如果没有完全访问这些信息,几乎没有人可以拥有,我们将无法构建模型来实现我们的设计。
 
 
       Then we turned to another direction and would like to build an App that can analyze the influence of the content of a Vlog (a kind of video of YouTubers that represent their daily life) and its cinematography on audience behaviors, which could help a vlogger analyze if the vlog content was appealing to their audience.  After reading literature,  we encountered another problem, how could we gauge the influence in a measurable way, as we failed to find one in existing papers.  As a solution, We tried to collect the audience’s evaluations after viewing a certain vlog through a questionnaire. However, after several modifications and reversion, we denied the idea. On one hand, it was more than difficult to assess the audience engagement solely through a questionnaire, on the other hand, to find qualified Vlog viewers with common interests was also a problem.
 
       然后我们转向另一个方向,并希望构建一个应用程序,可以分析Vlog(一种代表他们日常生活的YouTubers视频)的内容的影响和它对观众行为的电影摄影,这可以帮助vlogger分析如果vlog内容吸引了他们的观众。在阅读文献后,我们遇到了另一个问题,我们怎么能以可衡量的方式衡量影响力,因为我们在现有的论文中找不到。作为解决方案,我们尝试通过调查问卷查看某个视频博客后收集受众的评估。然而,经过多次修改和回归,我们否认了这个想法。一方面,仅通过调查问卷评估受众参与度是困难的,另一方面,找到具有共同兴趣的合格Vlog观众也是一个问题。
 
 
       Thus, we turned to another idea, developing a software which helped viewers to index the Vlog content easily and to retrieve the Vlog content quickly instead of stepping forward and backward. Basically, we wanted to extract the characters and scenes with the time of emergence in a Vlog and provide them to viewers as extra information by using computer vision technology and natural language process, so that they could index some snippets in the video with less struggle.
 
       因此,我们转向另一个想法,开发一个软件,帮助观众轻松索引Vlog内容,并快速检索Vlog内容,而不是前进和后退。基本上,我们希望在Vlog中随着时间的推移提取角色和场景,并通过计算机视觉技术和自然语言过程将它们作为额外信息提供给观众,这样他们就可以用较少的挣扎来索引视频中的一些片段。
 
 
       We’ve already read a lot of literature and started software development this week. I hope this time we won’t encounter hard difficulties and won’t have to change our mind anymore. Also, I like the current idea. It agrees with my interest, especially the part of learning and using computer vision technology and natural language process, which could benefit me for the application.
 
       我们已经阅读了大量文献,并在本周开始进行软件开发。我希望这次我们不会遇到困难并且不再需要改变我们的想法。另外,我喜欢当前的想法。它同意我的兴趣,尤其是学习和学习的部分使用计算机视觉技术和自然语言过程,这可以使我的应用程序受益。
 
 
       In the last two weeks, I learned about the major process of building an App, including thinking out of ideas, determining the user needs, reading documents and reading literature.
 
       在过去的两周里,我了解了构建应用程序的主要过程,包括思考想法,确定用户需求,阅读文档和阅读文献。
 
 
       Also in this weekend, guided by the Professor F, other undergraduates and I visited downtown and museums in Pittsburgh and learned about the history of this historical city.
 
       同样在这个周末,在F教授的带领下,我和其他本科生一起参观了匹兹堡的市中心和博物馆,了解了这座历史名城的历史。
 
 
第3--7周
 
       前2周的摸索,老师和我确定了科研大方向,也就是通过分析视频日志(Vlog),来帮助提升视频的观看的体验。
 
       在前期的调查中我们发现,用户在观看视频时常会有快进,跳跃视频段落的习惯。其中包括不少原因,比如,用户对有些视频段落不感兴趣;用户想节约时间,快速了解一下视频讲述的内容;用户只想看某些明星出现的片段等等。事实上,用户在快进的时候总是要快进好多次,而且不少时候要倒退才能找到想看的片段。为了更好的用户体验,我们希望有一款产品能够帮助他们实现视频观看时的快速定位,根据场景和任务找视频片段的功能。
 
       还有,用户也有留言的习惯,主要是为了解视频中提到的产品,出现地点;以及留言获取视频编辑时,使用的背景音乐。有时视频上传者会在视频的简介中附上产品的链接,或者其他的用户会在下方附上链接进行回复,可是也有不少时候,这些用户的提问并没有得到即时回应。我们认为,我们可以有更好的交互模式来让用户获取这些信息,我们想让用户能在观看视频的同时就获取到他们想要的信息。
 
       于是接下来几周,我们进入产品需求的制定,产品的模型图的绘制和最小化产品的开发工作中。
 
       首先我们确定了产品以一款浏览器插件的形式出现。因为浏览器插件对用户而言,安装使用非常友好,而且浏览器插件是一个轻量的开发过程,可以让我们尽早的推出一个最小化版本的产品。
 
       我们讨论了可能实现需求的各种技术方案,最后确定下来利用神经网络技术,从视频中抓取出现的人脸和场景,然后通过浏览器插件植入到视频播放器中,展示给用户,提高用户观看视频的效率。
 
       于是,我们制定了产品的系统架构,开始开发产品的部分功能模块。
 
       同时我们也绘制了产品的模拟草图。
 
       在开发的过程中,我们花费了很大的力气在关键帧提取,场景抓取和人脸抓取的算法上。
 
       在人脸识别的算法使用上,我们经过多次对比,从传统的hop算法转移到了使用已有的神经网络CNN算法上来。我们使用了名为dlib开源库,其使用的算法包括的运用深度学习,支撑向量机等机器学习的算法。
 
       在场景抓取的算法上,我们使用了经典的VGG网络,用于训练的数据集是MIT的place365数据集。
 
       同时,为了提高软件处理场景抓取和人脸抓取算法的效率,我们使用算法将场景和人脸获取到的数据进行降维。
 
       为了将视频中反复出现的场景合并到为同一个场景,我们使用了Kmeans算法对抓取的场景进行聚合。
 
       第七周(也就是8月底)结束之后,到目前,由于我在备考GRE,每天的开发时间被压缩了,所以项目进度有些放缓。
 
科研起源
 
       在最新的世界学术水平排行榜中,绝大部分都是美国的大学。由于美国大学与工商业、企业结合紧密,同时学校的教学资源、实验课题及实验设备都属于全球顶尖状态,从而成为众多留学生的梦想留学目的地。
 
       目前中国学生申请赴美留学人数日益剧增,以往美国顶尖名校选择录取GPA高分学生,后来校方逐渐发现学生在学习中缺少创新和实操的能力,进而导致美国名校录取率的下降。近些年,招生官对选择学生时更加看重的是自主创新、专业技能、思维创造才能等综合素质人才。对于计划入读美国名校的学生,实际的科研经验无疑可以提升竞争力,从而大大增加被名校录取的概率。
 
       美国名校科研,坚持为更多有梦想的学生提供机会和平台。
 
 
选拔流程
1. 提交报名表
2. 科研组择优面试
3. 面试通过后,发送录取确认书
4. 协调机票、接机、住宿
5. 赴美开始科研
6. 获得导师推荐信,科研证书,丰富的CV、PS履历
 
 
科研的收获
       推荐信、科研证书、科研履历
 
哪些学校
       哈佛大学、麻省理工学院、哥伦比亚大学、宾夕法尼亚大学、约翰霍普金斯、卡耐基梅隆大学、斯坦福大学、加州伯克利等。
 
哪些专业
       经济,金融,计算机,电子,统计,数学,生物,心理等