杀疯了…4个月发表论文的实操手册来了!

科研的本质:解决问题,创造新事物(新问题、新方法、新发现、新理论)

科研论文的关键的体现在于将所得结果详实记录并进行科学分析后,总结成果写成论文由同行评议认可后发表。

c8ec5cc902eed6a635085da83f1ab195.png

科研的完整过程

那么如何在4-6个月内产出论文呢,这次我和一些担任AAAI,ACL,EMNLP等多个会议期刊的审稿人聊了聊,给大家准备了以下攻略,希望对大家有所帮助。

扫码0.01元领取

《4-6个月产出论文实操手册》

519aa2b099c2976e302bfb64b0e20463.png

一、如何调研确定topic

什么是好的topic,就如同寻找网易云音乐的小众歌手:

01:越直观简单越好:简单意味着自己领域知识的学习成本低,例如NLP的文本分类,CV的人脸识别

02:越小众越好:越小众,说明研究的人越少,研究竞争难度低,例如医学和CV结合的方向,NLP和生物信息(例如药物挖掘)的交叉方向

(一)如何调研确定topic

如何去寻找小而美的topic,要走金山里面找金子。

step0: 确定含金量最高的信息源

翻所在领域近三年的顶会文章,NLP领域主翻ACL/NAACL/EMNLP的顶会文章,CV主翻CVPR/ECCV/ICCV的顶会文章,机器学习主翻NIPS/ICLR/ICML,图与数据挖掘主翻KDD/WWW/SIGIR

step1: 只看论文标题,确定10-20篇准备看摘要的论文

浏览找到顶会文章的paper title list,根据直观易懂且小众原则排序选出10-20篇论文看摘要。

step2: 看10-20篇准备看摘要的论文

找到3-5篇摘要看的懂的论文,仍然是直观易懂且小众排序原则。

step3: 精读3-5篇论文,确定研究的topic,找到一个觉得我可以的topic

精读3-5篇论文,对每篇论文所涉及的topic回答下面几个问题:

  • 这个topic目前3-5个公认baseline以及公认的evaluation datasets是什么;

  • 这些baseline是不是卷到特别复杂;

  • datasets是不是刷到特别饱和;

  • 代码是不是自己很快可以看懂一键run起来。

扫码0.01元领取

《4-6个月产出论文实操手册》

(二)如何确定idea

空想无用,实践才能出真知。

step0:平地不好起高楼,找到好的代码

确定topic之后,搜索相关baseline的开源实现代码,评判原则readme完善,看的不吃力,跑起来容易。

step1:纸上得来终觉浅,觉知此事要躬行

确定好的开源代码实现后,对比原始论文,把对应的实验都跑一遍,看看能不能复现论文实验效果

以及对实验的数据集多做error analysis和case study,反复实验和分析数据,洞见到提升点,能找到提升点,自然就可以产出idea。

step2: 多多讨论,寻求合作

独立科研能力虽然重要,但是对于小白更需要找到好的合作者和引路人,和相关论文代码作者多发邮件讨论问题,甚至可以邀约合作。

也可以多找靠谱的师兄姐同学讨论,一个人干很容易迷茫。

在讨论和合作中,可以更加明确idea,当然记住idea也要谨慎透露,防止idea被剽窃。

扫码0.01元领取

《4-6个月产出论文实操手册》

40e89fa8affc64eea45836224e1e861d.png

二、如何多快好省做实验

工程思维,快速迭代。

step0:0-1 阶段,快速验证想法

万事开头难,确定idea之后,要快速实现idea验证想法没有问题,如果没有问题,自然一顺百顺。

如果有问题,解决方法如下:

首先,最小迭代原则,自己的idea最好是在基础代码上的逐步迭代,确保实验不顺需要分析考虑的对象最少化。

其次,勇于跳坑,如果某次的实现发现经过一段时间努力后没有效果并且分析不出,及时跳坑,考虑换一个代码baseline实现,甚至要重新review讨论idea。

step1: 1-10阶段,完整solid的实验方案

实验越全面翔实,论文中稿概率越大,一个统计数据method+实验部分接近论文页数限制,基本可以中稿。

开了好头,接下来是最见逻辑和思考的阶段,初步想法验证后,需要扩展实验和分析。

如何扩展实验,借鉴baseline对应论文的实验setting确定自己要做哪些ablation study实验以及补充哪些数据集的实验

如何进行分析,分析最关键的是要解释出自己的实验效果如何好,一般针对自己argue的几个点,给出定量的曲线统计实验或者定性的case study实验。

扫码0.01元领取

《4-6个月产出论文实操手册》

9dc3e0380e6abe7b42488a14095cbf3a.png

三、如何翻过论文写作的山

先写再改,尽量降低自己的学习曲线和执行难度。

Tips:这份操作手册的核心就是以平滑的学习曲线完成自己的第一篇论文,一回生二回熟,一回生很重要。

step0: 模仿式写作

模仿实验中对比baseline的几篇文章组织和写作,优先把intro method和experiments部分写完,这一步先把内容都堆砌上再说。

step1: 梳理逻辑,讨论修改,明晰文章思路和逻辑

多寻求外部帮助,找到毕竟senior的人帮你看几遍文章,找到你文章中的明显的行文和逻辑问题;

找不到senior的人看,也可以找同等水平甚至门外汉看,这里就是跟着他们读带他们理解你的意思,这个过程中,自己同步可以发现自己的逻辑漏洞;

实在没人看,那就是自己化身reviewr反复challenge自己。

总结,这一步的修改,是找到反馈,迭代修改几轮,让自己文章的主线和思路清晰起来

step2: 格式调整,语言润色

内容基础框架和思路确定之后,就是文章的美化了。

  • 首先是格式,严格按照所投会议或者期刊的要求调整好自己论文的格式;

  • 然后语言,这里推荐quillbot,开会员直接可以帮你改写到地道。

  • 最后是图表,图表多学习其他顶会文章的图表范式,美化好自己的图表,尤其是图,一图胜千言

扫码0.01元领取

180篇AI论文讲解课

9a9ad5f1129d22c046f5963a41b66b8f.png

以下是论文写作干货详细大纲

《180+条AI论文讲解课》

论文/课件/代码/数据集| 论文写作必备

CV篇

CV baseline —— Alexnet

1. 图像分割 —— FCN

2. 目标检测 —— YOLO V3

3. GAN —— 原生GAN

4. OCR —— CRNN

5. 轻量化网络 —— MobileNets

6. CV-transformer——VIT

7. 人脸识别——Eigenfaces

8. 三维重建 —— Alexnet

NLP篇

NLP baseline —— Word2Vec

1. 信息抽取(命名实体识别) —— LSTM

2. 信息抽取(关系抽取) —— CNN_for-re

3. 预训练模型 —— Transformer

4. 图神经网络 —— Nord2Vec

5. 文本匹配 —— DSSM

6. 机器翻译 —— Luong NMT

7. 情感分析 —— TextRNN

8. 阅读理解 —— MRC model

9. 对话系统 —— jointBERT

10. 强化学习 —— DQN

17c78f1e6e5bd90e68511672e8b7131e.png

课程展示

8d10fc97f9f3a4fd133a1c1659ac3129.png

课程展示

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/476722.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

tkinter的可视化拖拽工具_可视化越做越丑?这五个高级图表效果实现流程分享给你...

今天我们来说一说数据可视化,想必很多人在入门数据分析之后,就会经常进行可视化的工作,所谓一图胜千言,图表用的好,真的是会事半功倍的。但现实情况下,很多人遇到的问题是:你做的图表太丑了&…

WinForm的App.config

项目右键&#xff0d;&#xff0d;添加&#xff0d;&#xff0d;添加新项&#xff0d;&#xff0d;选择应用程序配置文件 即出现App.config.打开App.config, 键入&#xff1a; <appSettings></appSettings>然后在 appSettings中就可以定义变量及变量的数值了。比…

LeetCode 1403. 非递增顺序的最小子序列(排序)

1. 题目 给你一个数组 nums&#xff0c;请你从中抽取一个子序列&#xff0c;满足该子序列的元素之和 严格 大于未包含在该子序列中的各元素之和。 如果存在多个解决方案&#xff0c;只需返回 长度最小 的子序列。如果仍然有多个解决方案&#xff0c;则返回 元素之和最大 的子…

独自一人,怒发AI顶会论文

长短作为曾经熬通宵肝论文的过来人&#xff0c;小编要吐槽&#xff0c;论文写久了真的会头秃&#xff0c;尤其是确定选题和找创新点、idea的时候&#xff0c;是薅头发事件的高发阶段。对于那些导师放养、在自己的摸索中磕磕绊绊前行的科研新手们&#xff0c;焦虑总是瞅准时机就…

winform响应时间最长是多少分钟_当詹姆斯退役时,他的总出场时间会达到多少分钟?...

在勒布朗-詹姆斯进入他职业生涯的第17个年头之际&#xff0c;Bleacher Report将目光锁定在了这位四届MVP的身上&#xff0c;在度过即将到来的2019-20赛季以及剩余的名人堂职业生涯之后&#xff0c;他的多项数据在联盟历史中会处于怎样的地位呢&#xff1f;詹姆斯已在历史排行榜…

[转载]WebBrowser知识

WebBrowser知识WebBrowser知识Q: What is WebBrowser?A: The WebBrowser is Microsofts Internet Explorer in the form of an ActiveX control. It can be imported into the Delphi IDE and dropped on a form like any other component. Therefore, you can harness the po…

LeetCode 1404. 将二进制表示减到 1 的步骤数(字符串加法)

1. 题目 给你一个以二进制形式表示的数字 s 。请你返回按下述规则将其减少到 1 所需要的步骤数&#xff1a; 如果当前数字为偶数&#xff0c;则将其除以 2 。如果当前数字为奇数&#xff0c;则将其加上 1 。 题目保证你总是可以按上述规则将测试用例变为 1 。 示例 1&#…

可以炸掉用户脑袋的VR设备来了!元宇宙与现实连接了?

编 | Aeneas 昕朋源 | 新智元游戏失败就杀死你的头显&#xff0c;就问你敢不敢戴&#xff1f;对于很多游戏设计者来说&#xff0c;游戏里的死亡根本不够刺激。在他们看来&#xff0c;要玩就玩真的——在游戏里死了&#xff0c;你就是真死了。Oculus VR创始人帕尔默洛基&#xf…

spark调用python_在MRS集群中使用Python3.7运行PySpark程序,调用RDD的take函数报错处理...

现象 如果我们安装了python3.7版本来运行spark&#xff0c;并且用到了RDD的take函数&#xff0c;就会报错&#xff1a;RuntimeError: generator raised StopIteration 我们可以编写一个python脚本test.py来进行测试&#xff0c;用spark-submit命令提交&#xff1a; spark-submi…

对称加密(DES)

usingSystem;usingSystem.Collections.Generic;usingSystem.Text;usingSystem.Security.Cryptography;usingSystem.IO;namespaceComponent{ public class Security { public Security() { } //默认密钥向量 private static …

AI终于能替我写论文了

编 | 小舟、陈萍源 | 机器之心Meta AI 提出了一个可以总结学术文献&#xff0c;解决数学问题的新模型&#xff0c;该模型还能生成百科文章&#xff0c;编写科学代码&#xff0c;注释分子和蛋白质等等。近年来&#xff0c;随着各学科领域研究的进步&#xff0c;科学文献和数据呈…

网站访问量怎么刷_基于爬虫刷新某网站访问量!我说怎么上千万呢

前言&#xff1a;前一段时间看到有博友写了爬虫去刷新博客访问量一篇文章&#xff0c;当时还觉得蛮有意思的&#xff0c;就保存了一下&#xff0c;但是当我昨天准备复现的时候居然发现文章404了。所以本篇文章仅供学习交流&#xff0c;严禁用于商业用途当我在写文章的同时&…

入市

最近很忙&#xff0c;不是工作&#xff0c;是因为入市。 前天买入第一支股票开始&#xff0c;整个脑袋就开始忙碌起来。什么也顾不得了&#xff0c;时不时偷偷瞄几眼&#xff0c;跌了&#xff0c;就盯着股票曲线图&#xff0c;似乎自己多盯一会儿&#xff0c;那个曲线就会涨…

LeetCode 1405. 最长快乐字符串(贪心)

1. 题目 如果字符串中不含有任何 aaa&#xff0c;bbb 或 ccc 这样的字符串作为子串&#xff0c;那么该字符串就是一个「快乐字符串」。 给你三个整数 a&#xff0c;b &#xff0c;c&#xff0c;请你返回 任意一个 满足下列全部条件的字符串 s&#xff1a; s 是一个尽可能长的…

我裂开了...人类脑海中的画面,被AI解码了??

作者 | 白鹡鸰导言有没有那么几个瞬间&#xff0c;你要么想把自己脑子里的东西掏出来给别人看&#xff0c;要么想撬开别人的脑子看看里面都装了什么&#xff1f;虽然错过了霍格沃茨的入学时间&#xff0c;但如果从现在开始学习扩散模型和神经学&#xff0c;可能很快你就能实现这…

我的老师

他的人品,学识是对我的一生都有很大的影响&#xff0c;下面的内容都是事实&#xff0c;因为我是他的学生(1992-1995)&#xff0c;一生中我都是他的学生 From: http://211.67.168.43/infoshow.aspx?id118 我是这样做教师的——师德标兵李九成老师先进事迹报告大家好&#xff01…

python构建二叉树_python--使用递归的方式建立二叉树

树和图的数据结构&#xff0c;就很有意思啦。# coding utf-8 class BinaryTree: def __init__(self, root_obj): self.key root_obj self.left_child None self.right_child None def insert_left(self, new_node): node BinaryTree(new_node) if self.left_child is None…

GPT-4要来了?传言:先进到与人类无异

编 | Cris源 | 新智元千呼万唤始出来&#xff01;GPT-4&#xff0c;真要来了&#xff1f;作为史上最受期待的AI模型&#xff0c;GPT-4真要来了&#xff1f;这几天&#xff0c;AI分析师罗梅罗的一篇专栏文章&#xff0c;一经推出便迅速「引爆」了整个AI科技圈。他表示&#xff0…

LeetCode 1406. 石子游戏 III(DP)

1. 题目 Alice 和 Bob 用几堆石子在做游戏。几堆石子排成一行&#xff0c;每堆石子都对应一个得分&#xff0c;由数组 stoneValue 给出。 Alice 和 Bob 轮流取石子&#xff0c;Alice 总是先开始。在每个玩家的回合中&#xff0c;该玩家可以拿走剩下石子中的的前 1、2 或 3 堆…

[引]VS2005 之 Visual Basic 程序的结构

1.文件级编程元素 2.命名空间级编程元素 3.模块级编程元素 4.过程级编程元素 5.Main 过程 Visual Basic 程序是依据标准的构造块建立起来的。 一个解决方案由一个或多个项目组成。 一个项目又包含一个或多个程序集。 每个程序集是依据一个或多个源文件编译而来的。 源文件提供类…