QQ登录

只需一步,快速开始

微信登录

扫一扫,访问微社区

查看: 6130|回复: 0

语料库软件在看电影美剧学英语中的实践运用

[复制链接]

70

主题

70

帖子

840

积分

超级版主

Rank: 8Rank: 8

积分
840
发表于 2020-5-19 15:45:38 | 显示全部楼层 |阅读模式
还在用联想记忆的方法总结出来的单词宝典吗?拥有上万个单词量却写不出一篇地道通俗的英语文章?看过多部英语原声影视剧,英语能力却没有获得实质性的提高?……如果你正在为以上的问题感到困惑,毫无疑问是遇到瓶颈了。

请不要焦虑,通常知识面越宽的人越容易迷失航向。“走火入魔的人往往是功力高深的智者”,因为你所练就的一身内力在体内四处乱窜,而缺少一种行之有效、将其提炼融合到任意位置的凝聚力。

下面的这篇看美剧学英语的文章(同样适用于看电影学英语),希望能够帮助你打通“听说二脉”,感兴趣的朋友请现在屏气凝神,注意下面一张图:

qw2.jpg

上图中一共收录美剧十二部,包含1246个剧集,覆盖词条数:50397个,出现词频总计:4940064个,见下图:

qw3.jpg

这十二部美剧涵盖超过600小时的英语原声视听内容。

统计思路:该资源库包含四部情景喜剧(破产姐妹、老友记、生活大爆炸及摩登家庭),平均每集约22分钟,共计637集;另外8部美剧,平均每集约43分钟,共计609集,由12部美剧组成的语料库总计时长约为40000分钟。大概需要1个月不吃不喝不睡觉才能看完。

超过一万个热门词条出现频率在十次以上

qw4.jpg

备注信息:(语料库来源:91talk历时三年整理  统计软件:Antconc

很大一部分的英语学习者的主要瓶颈在于:不能达到流利地脱口而出,这是因为:我们太过注重积累单个的词汇量,而忽略了加强积累英语母语国家常用的短语和情景语句。在输入的过程中,以点盖面的方式本身无可厚非,但达到一定阶段,就需要反向思考:着重输出练习。否则一个词一个词的拼结,永远也达不到流利顺畅,更别提像英语母语人士那样脱口而出了。

结合情景和自己的兴趣点来记忆整句对白、短语表达以及衔接词将是摆脱“嗑巴英语”比较科学的方法。如果能够熟悉一个短语或句式在3个以上的场景的运用,足以形成条件反射。著名英语学习软件:“罗塞塔石碑”之所以受到很多语言学家的推崇和英语学习爱好者的追捧,就是采用了这种条件反射式的“二语习得模式”。而本人整理的这套资源库要比“罗塞塔石碑”更加通俗全面,不仅适用于中高级进阶、而且有大量的情景再现和词汇关联。

有了这套资源库,或者专业一点来讲,我们称它为:Corpus(语料库),对于提高日常听力口语来说:你还需要到处“寻砖问瓦”求推荐吗?随便选择其中一到两部,足以满足日常口语会话句型和词汇量。

下面我举几个例子,来简要阐述如何利用这套“美剧语料库”来学习英语的。

我给它起了个雅号叫:COAT(Corpus of American TV-Series),如果后来提到它,希望你还能记得它是“美剧语料库”的简称。

01.使用“索引”功能,查找单词或短语

1、打开AntConc软件,点击“File”菜单项的“Open Files”,在弹出的窗口下方,将文件类型选择“All Files”,如下图所示:

qw5.jpg
备注:AntConc软件默认支持的文件格式为TXT文本文件,而本人整理的语料库为LRC文本,这样做是为了便于大家精确定位要查找的词汇,知道这个单词或短语是在XX剧的XX集的XX分XX秒出现,如果你有这部剧的视频资源,就可以快速定位到你需要观看的场景。

2、双击打开语料库所在文件夹,我的命名为“COAT”,如下图所示:

qw6.jpg

3、单击选中“COAT”文件夹内的任意一个文件,(注意不是双击),然后同时按住“CTRL”+“A”键,选中所有的美剧LRC文本,如下图所示:

qw7.jpg

点击“打开”按钮,即可调用软件使用界面,左下方显示目前已经加载的文件数量为1233个,如下图所示:

qw8.jpg

这里已经加载的文件数量与我在开篇给出的“1246”个有所差异,是因为有几部美剧是两集连播,对应的LRC也是两集合为一个文本的方式整理的。

4、确认鼠标已选中“Concordance”选项卡,然后在“Search Term”输入需要检索的单词或短语,点击“Start”,我这里已经截取了两张图,分别给大家展示搜索短语“figure out”为例,给大家截图展示查询结果如下:

qw9.jpg

这个短语在“COAT”里面出现了350次,并且以蓝色高亮突出显示,链向这个短语所在剧集的具体位置,点开第一个蓝色文字链接后,如下图所示:

qw10.jpg

我们可以得知这个短语在“Desperate Housewives”第一季第十六集的17分51秒左右出现了一次,我们可以拖拉右侧的滚动条观看上下文,以理解该短语出现的场景。5、下面我尝试搜索一个频率不高的短语,如“On the verge of”,然后放大窗口,给大家截图演示如下:

qw11.jpg

COAT里面出现过“On the verge of”这个短语共计13次,具体出现的剧目分别存放在右侧的“File”列表框内(如上图所示),当点击索引制图“Concordance Plot”选项卡时,我们可以很直观的了解到:“On the verge of”这个短语出现在哪部剧集的哪个位置,黑色的竖线代表该短语在某部剧集中出现的频率,点击该竖线,能直接跳转到该短语所在剧集的具体位置(与蓝色的文字链接效果一致。)

qw12.jpg

02.使用“单词列表”功能,统计词条数及使用频率

确认鼠标已选中“Word List”选项卡,点击“Start”按钮,AntConc软件能够在极短的时间内帮你计算出单部美剧所包含的单词数量及频率,以《绝望的主妇》为例,只需要三到四秒钟的时间,COAT里面所包含的12部美剧只需要不到15秒钟,当然处理器比较老的,可能需要耗费的时间长一点。BTW,我使用的是笔记本电脑i7-4720HQ。

qw13.jpg


由于在美剧对白中有大量的缩写形式存在:比如Let’s、I’m、We’re、Don’t……AntCroc软件会将这些缩略词汇视作两个单词,再加上有些剧集里面会有除英语外的第二类语言,比如法语,也会影响整体统计的精准度。不过按照50000万个单词的基数来看,这样缩写形式、第二门外语以及可能出现的单词拼写错误,只占不到百分之一,对整体结果权威性影响不大。

03.使用“Collocates”与“Clusters”功能提取搭配词表和短语

1:检索搭配词:确认鼠标已选中“Concordance”选项卡,选择需要检索的单词,比如“stick”,根据需要设置搭配词的位置、出现的最少次数与词表的排列方式。我这里设置为检索以“stick”开头,只要在COAT里面出现过一次的所有短语及句子。如下图所示:

qw14.jpg

2:提取搭配短语:确认鼠标已选中“Cluster”选项卡,选择需要检索的单词,比如“take”,设置检索项的位置,如选择“On the left”;设置搭配词区块数量,我这里选择为2-4个,再设置最小出现的频率范围及词条数,我这里选择不得少于10次,词条数不得少于5个,得到结果所下载所示:

qw15.jpg

本软件的功能非常强大和实用,我这里只是针对比较重要的模块做了介绍,想了解更多详细的功能和操作方法,可以关注公众号,回复“语料库”,了解最新的语料库剧集和其在影视英语学习中的实践及应用。

写到这里,相信我的这篇文章能希望通过看美剧学英语的同好们打开思路,COAT非常适合英语教学研究的老师和专业学者。再加上总共不到50M的体积,非常轻盈小巧,方便存储和携带。而且获取成本不高,加入影视英语VIP付费群,即可获得本套资料及运用方面的支持,还有更多影视英语个性化服务等你来发掘哦。

qw24.jpg

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

在线客服
QQ:137000528 周一至周日:09:00 - 21:00
俱乐部地址:北京市朝阳区朝阳路71号锐城国际

影视英语角眼于语言实际应用能力,融汇先进务实的教学方法和时尚前沿的科技理念,整合听觉、视觉、情景交流与快速阅读四大功能,从多个维度帮助英语学习者全面提升听、说、读、写各项技能。

技术支持: Owen Lee  @ 英语我帮您© 2013-2019 影视英语角

QQ|Archiver|手机版|小黑屋|有奖任务|影视英语角 ( 京ICP备17000586号-3 )

GMT+8, 2024-4-25 17:55 , Processed in 0.098259 second(s), 32 queries .

快速回复 返回顶部 返回列表