当前位置首页 >> 八卦中心 >> 正文

成长的力量——安州区东辰学校举行第十届学术节之教师分层分类培训成果展示

更新时间: 2025-05-19 11:39:33

阅读人数: 303

本文主题: 体育类文本的特点

    7月10日,安州区东辰学校举办了第十届学术节之教师分层分类培训成果展示,向社会各界汇报教师分层分类培训的成果,展示学校教师成长的力量。        活动现场,安州区东辰学校总支书记、校长廖俊致辞。学科教师代表根据学科特点,分别展示了配音秀、绘画、剪纸、书法、乐器演奏、体育技能、文本解读等教学技能,充分体现了该校教师过硬的专业基本功。学科教师代表还分别从专业技能、师德师风、 教学常规等方面分享了自己的成长故事。    随后,该校发布了《成长的力量》教师成长成果集,开展了主题沙龙分享,展示了教师分层分类培训所具有的实效性、持续性和创新性。    最后,该校对分层分类培训下成长起来的优秀个人和团队进行了表彰。    “志之难也,不在胜人,在自胜”,成长就是与自我的搏斗,那些在劈波斩浪中开拓前进的责任担当,那些在披荆斩棘中开辟天地的艰苦奋斗,那些在攻坚克难中创造成就的默默付出,终将成为安州东辰人的宝贵财富,汇成安州区东辰学校的无限精彩。

成长的力量——安州区东辰学校举行第十届学术节之教师分层分类培训成果展示

恒源云(gpushare)

文章来源 | 恒源云社区(恒源云,专注 AI 行业的共享算力平台) 原文地址 | 论文笔记 原文作者 | Mathor我在,或者我不在,大佬就在那里,持续不断的发文! 所以,我还是老老实实的搬运吧! 正文开始: 文本扩增(Text Augmentation)现在大部分人都在用,因为它可以帮助提升文本分类的效果,具体来说常用的方法包括但不限于:替换、删除、增加。一般来说文本扩增都会使得最终的性能更好,少部分情况下会更差。你或许可能想过是因为诸如删除、替换等方法将句子中一些重要的词给抹去了,但是到底句子中那些词是重要的词呢?哪些词可以进行扩增,哪些词最好不要扩增? ACL2022有一篇名为《Roles of Words: What Should (n’t) Be Augmented in Text Augmentation on Text Classification Tasks?》的投稿研究了这个问题,并且给出了指导方法。首先作者对FD News数据集进行训练,最终在测试集上的准确率为98.92%,这说明模型对数据集的拟合程度非常好。接着作者手动输入几个测试样本,如下所示 因为单词"basketball"和"athletes"经常出现在"sport"类的训练样本中,所以模型能非常准确的将其预测为"sport"类;然而从第2和4个样本来看,模型的表现并不像我们想象的那么好。由于"Based on"和"team"在训练集中经常与类别为"sport"的句子共同出现,模型被这种数据集进行训练后,自然会带有一点「偏见」;从最后一个例子来看,模型无法正确识别出与体育相关的专业词汇:三分(three-pointer) 上面这个例子启发我们从「统计相关性」和「语义相似性」两个角度看待句子中的每个词。具体来说,我们可以从这两个角度给每个词分配一种「角色」,总共有4种角色:Common Class-indicating words (CC-words):高统计相关性与高语义相似性 Specific Class-indicating words (SC-words):低统计相关性与高语义相似性 Intermediate Class-indicating words (IC-words):高统计相关性与低语义相似性 Class-irrelevant words/Other words (O-words):低统计相关性与低语义相似性STATISTICAL CORRELATION & SEMANTIC SIMILARITY 作者采用weighted log-likelihood ratio (WLLR) 衡量句子中的每个词与类别之间的统计相关性,WLLR分数的计算公式如下: 其中,www是一个单词;yyy是一个类别;yˉar{y}yˉ​代表所有类别。wllr(w,y) ext{wllr}(w,y)wllr(w,y)越大,词www与类别yyy之间的统计相关性越高 为了衡量两个词的语义相似度,最直接的办法是计算两个向量的余弦相似度,但是这里作者并没有使用比较复杂的BERT-based模型提取单词的向量,因为需要比较大的计算资源,作者直接使用简单的Word2Vec方法得到一个单词的向量。预先相似度的计算公式如下: 其中,lll代表类别,vw,vlv_w,v_lvw​,vl​分别代表词和类别的向量表示一般来说类别都是有文本描述的,例如"体育"、"电脑"等,我们直接使用其描述当作lll计算完给定句子中所有词的统计相关性与余弦相似性之后,我们设定一个阈值以区分高(低)WLLR分数Ch(Cl)C_h(C_l)Ch​(Cl​),同样也要区分高(低)余弦分数Sh(Sl)S_h(S_l)Sh​(Sl​)其中,WCC,WSC,WIC,WOW_{CC}, W_{SC}, W_{IC}, W_{O}WCC​,WSC​,WIC​,WO​分别表示CC-words, SC-words, IC-words以及O-words。一个真实的抽取样例如下 RESULTS 作者实验时使用的阈值为两个指标的中位数。首先是删除实验 从结果来看,删除CC-words对性能的损失影响非常大;删除SC-words和IC-words带来的积极影响比较多。实际上第一条结论我们很容易想到,因为CC-words与标签同时具有高相关性与高语义相似性,将它删除肯定会大幅降低模型判断的准确率。但是后一条结论有些不符合我的猜想,我一开始认为删除O-words会更好,因为O-words与标签并不怎么相关,删除它也无伤大雅。但事实是删除SC-words和IC-words效果更好,论文里的解释是,因为SC-words与标签的统计相关性比较低、语义相似性比较高,删除这些词可以强迫模型更关注CC-words。IC-words与标签的统计相关性比较高、语义相似性比较低,论文解释说,IC-words通常是一些带有噪声以及bias的数据,删除它们可以帮助模型避免学到关于该类别的不正确特征 同理,作者也做了插入、替换、交换的数据扩增方法,这里就不一一列出结果了,感兴趣的读者自行阅读原论文即可。下面贴一张表,是作者对四种数据扩增方法使用的一个总结 个人总结 这篇论文提出了一种有选择性的文本扩增方法。具体来说,论文设定了四种角色,并且将每个单词分配为一个角色,面对不同的扩增手段,对不同角色的单词进行操作。这样可以有效地避免信息损失,并且生成高质量的文本数据

ai赋能体育赛事,麒纪科技为“村ba”拉满科技范儿 - 中国日报网

台盘村作为“村BA”(乡村篮球联赛)的发源地,自2022年8月短视频爆火出圈后,至今已完成从台盘村“村BA”到黔东南州“村BA”、贵州省“村BA”、中国“村BA”的四连蝶变,累计获得网络曝光量超650亿次。村系列赛事不仅在国内掀起一波波浪潮,也引发海外媒体的热烈报道和民众的好奇关注。 在今年9月17日中秋之夜,来自美国的业余篮球运动员与身着苗族传统服饰的中国“姑妈”们,在贵州省台盘村共同演绎了一场别具一格的篮球竞技赛。这场跨文化的民间赛事,不仅见证了不同文化背景的交融,更值得一提的是,比赛还配备了一套流畅、生动的AI解说系统,为乡土体育赛事拉满科技范儿。 这套引人注目的AI解说系统由中国初创企业麒纪科技提供。麒纪科技成立于2022年10月,专注于多模态大模型技术应用,三位创始人均来自北京大学。此前,麒纪科技成功服务第19届杭州亚运会,其高速运动AI解说系统为乒乓球、跆拳道、跳水、体操等多项赛事提供了精彩的解说服务。 无规则遇上新科技:AI解说“村BA” "姑妈篮球赛"是“村BA”的一个分支,源于贵州省黔东南州的雷山县,已经有20年历史,这项独特的民间体育活动打破了传统篮球规则的束缚,创造了一种全新的比赛形式:球员可以抱着球奔跑,没有走步违例的概念,只要不是故意犯规,原则上不会吹罚,多人抢球时,经常演变成一场女子摔角,正如当地人所说,"只要不把篮球抱回家,就不算犯规"。 苗寨“姑妈”们对篮球的重新定义,给观众带来了独特的观赛体验。面对“中美姑妈”篮球赛这场新颖的文化盛会,主办方也大胆启用了基于多模态大模型的AI解说系统,向全球呈现姑妈篮球赛的独特风采。 中美姑妈篮球友谊赛现场活动图 凭借在杭州亚运会上的卓越表现,麒纪科技的智能体育解说系统吸引了姑妈篮球赛主办方的目光,并成为此次活动唯一的科技公司合作方。在杭州亚运会期间,麒纪科技的高速运动AI解说系统有效整合了视觉、听觉、文本等多模态信息,成功解说了乒乓球、跆拳道、跳水、体操等赛事的比赛,展示了其在处理多样化体育项目时的灵活性和适应能力,特别是在一些相对小众的项目中,AI解说系统填补了专业解说员资源不足的空白,为观众带来了全新的观赛体验。 众所周知,解说是体育赛事不可或缺的一部分,肩负着传递现场氛围的重任。然而对于像姑妈篮球这类源自乡土、闪耀在民间的体育赛事而言,无论是培养和训练出适配赛事的专业解说员,还是分析、解说只有在民间篮球中才有的战术和动作,其难度与工作量都不亚于重新构建一套全新的体育赛事和组织,这也直接导致了民间体育赛事严重短缺高水平的解说员,令赛事观赏性大打折扣。 面对此次姑妈篮球赛这一独特的解说场景,麒纪科技通过多种前沿技术的融合应用、大量实际测试和持续的产品迭代,构建了一个基于多模态大模型的智能解说平台,在场景理解和情感表达方面实现了质的飞跃,大幅超越了现有的技术解决方案。 系统基于多模态视觉大模型,能够实时处理高帧率视频流,精确识别复杂的人体动作和场景信息。同时,系统集成了基于深度学习的增强型OCR技术,结合场景理解算法,能够在复杂背景中准确提取和解释文字信息。在内容生成环节,基于国产大模型基座,经过了多项体育赛事解说专门数据集的微调,不仅具备强大的自然语言理解能力,还能生成符合体育解说特点的流畅文本。 在最后的输出阶段,系统采用了先进的神经网络TTS(文本到语音)技术。这不是简单的语音合成,可以结合特定观众偏好的声纹特征,生成富有感情和节奏感的解说音频。 值得一提的是,该解说平台还可以将解说内容实时翻译成多种语言,包括普通话、英语、阿拉伯语等。 本次AI英语解说的姑妈篮球友谊赛得到了中国国际电视台的实时直播,这大大拓展了姑妈篮球赛的传播范围,让这项独特的民间体育活动能够走向世界。麒纪科技CEO庄棨宁表示,希望通过前沿人工智能技术赋能体育赛事,推动中国乡村体育在国际舞台上展现独特的文化魅力和创新精神。 在科技与文化深度融合的新时代,AI 为“村BA”提供解说服务,只是AI赋能中国文化体育产业、展示民族文化的一个缩影,相信随着AI技术的不断发展和应用,越来越多的中国文化将有机会被世界认识、理解和喜爱。期待在科技的助力下,中华民族优秀传统文化和体育赛事能够被更多人了解、传承,在现代社会的土壤中生根发芽。免责声明:该文章系我网转载,旨在为读者提供更多新闻资讯。所涉内容不构成投资、消费建议,仅供读者参考。【责任编辑:钟经文】

黑米吧

欢迎來到黑米吧指南,我们致力于提供全方位的日常生活健康知识,涵盖了各方面的科学知识,是值得信赖的社区。