NLPrompt
NLPrompt:
Noise-Label Prompt Learning for Vision-Language Models
噪声提示词用于视觉语言模型
意思就是:当现实标注的错的漏的标注,就是数据集带有噪声标签,这些噪声标签会降低提示学习的性能。
提示学习Prompt
Learning:使用prompt提示词的这类模型,是一类工作流。
作者:上海理工大学
来源:cvpr2025
代码地址:https://github.com/qunovo/NLPrompt
创新
在prompt learning中使用MAE
loss(平均误差损失)能够显著增强噪声标签的鲁棒性,而不是使用MCE
loss(交叉熵损失)。可以使用特征学习理论证明
提出PromptOT一种基于prompt的最优传输数据净化方法,利用视觉-语言模型中的文本特征作为原型,构建一个最优传输矩阵,把原数据集分为干净和噪声子集,对干净子集使用交叉熵损失,对噪声子集使用MAE损失。
MAE在传统范式中被认为是一种鲁棒的损失函数,但通常存在收敛缓慢且训练过程中性能不佳的问题,因而很少被用 ...
LLMDet
LLMDet:
Learning Strong Open-Vocabulary Object Detectors under the Supervision
of Large Language Models
LLMDet 在大语言模型监督下的强开放词汇物体检测器
作者:中山大学,阿里
来源:2025cvpr
代码:GitHub 仓库地址:
https://github.com/iSEE-Laboratory/LLMDet
领域:目标识别新进展
核心创新点:
一个新的数据集包含四元组(I,Tg,B,Tc),(一个图片,图片中物体的简短类别,物体标注框,全图的整体详细描述)
联合训练方法:在训练时候,同时执行两个任务
标准的目标检测Grounding,就是表示出物体在哪里
描述生成任务Captioning,描述出全图的一个详细描述,就是理解图像中实体的相对关系,状态等
LLMDet (Learning Strong Open-Vocabulary Object Detectors under the
Supervision of Large ...
HEF NET v2心电大模型
NEF-NET
V2: ADAPTING ELECTROCARDIO PANORAMA IN THE WILD
作者:香港科技大学(广州)
来源: ICLR2026
代码:https://github.com/HKUSTGZ-ML4Health-Lab/NEFNET-v2
背景
心血管疾病仍然是全球治病和致死的主要原因,每年夺走数百万生命,并带来深远的残疾负担。心电图(ECG)是不可或缺的一种诊疗手段,是非入侵性的,成本效益高的方法,能够迅速解释心脏电活动的复杂状态。
ECG视图状态的数量和实际复杂性和心脏状态的理解的全面性直接相关。标准的12导联心电图被认为是在获取成本和临床效用的一种实用折中。
image-20260313142045323
磁吸10个,还有手脚2个吗?
心电图
心电图记录的是心脏点活动的时间序列信号,每个心脏周期可以分解为留个不重叠的波形:P波,PR,QRS复合波,ST段,T波,TP段。通常的12导联心电图广泛用于心血管筛查,通常从6个肢体导联和5个胸导联采集10秒的记录。每个导联作为独立的传感器提供心脏电活动的空间不同视角,类似 ...
OverLoCK
OverLoCK:
An Overview-first-Look-Closely-next ConvNet with Context-Mixing Dynamic
Kernels
经典的使得cnn再次伟大的论文。
如今的科研环境,模型的创新已经被极大的限制,达成了一个Transformer结构的统一共识。
作者是香港大学俞益洲教授与博士生娄蒙。
论文链接:https://arxiv.org/abs/2502.20087
代码链接:https://github.com/LMMMEng/OverLoCK
发表平台:CVPR2025(oral)
创新点
传统卷积的思路是从细节到全局的特征提取,感受野逐步变大。这篇文章讲了一个Top-down
attention(自上而下的注意力机制)在人类视觉系统的作用的故事。核心思路是先用一个网络提取全局的语义信息,再逐步减小感受野,观察图像细节。
一个可变形卷积。和之前得到可变形卷积的区别在于,具有上下文混合能力的新型动态卷积。
维度
传统动态卷积 (如 CondConv ...
LLM
加州大学洛杉矶分校【中英⚡LLM与强化学习|Spring
2025, Reinforcement Learning of Large Language Mod】
理解LLM的本质
理解LLM把它看做一个智能体或许不是一个合适的看法,相反,可以理解为一个信息的插值数据库,这是一种相对于复杂的人类作法,力大飞砖的作法。这种作法或许才是正道。
加入的大量预训练数据集,填充了这个世界模型的各个小区域,这些小区域的插值可以得到不少的信息。
LLM可以看做一个用自然语言作为查询语言的一个大的数据库,具有融合和插值的功能。
强化学习为什么好
传统的深度学习实际上是一种被动学习的过程,类似填鸭式的教育,这种学习方式,在近十年的时间内被证明是有效的,但是现有的数据量和算力使得这种方式的效率到达了一个平台期,无法通过数据规模和模型规模的放大更进一步;
而强化学习是一种主动学习,在action和试错之间学习到规律,这或许是一个突破现有瓶颈
的方法。
No title
NLP新闻分类学习赛
https://tianchi.aliyun.com/competition/entrance/531810/forum
介绍
这只是一个经典的分类任务,从不等长的文本序列,得出一个新闻的分类,一共是13种新闻分类。
从分类算法的发展历史来说,这有800种方法可以完成
传统的机器学习算法
CNN网络
新的预训练模型,基于Transformer结构的网络
数据
label
text
6
57 44 66 56 2 3 3 37 5 41 9 57 44 47 45
33 13 63 58 31 17 47 0 1 1 69 26 60 62 15 21 12 49 18 38 20 50 23 57 44
45 33 25 28 47 22 52 35 30 14 24 69 54 7 48 19 11 51 16 43 26 34 53 27
64 8 4 42 36 46 65 69 29 39 15 37 57 44 45 33 69 54 7 25 40 35 30 6 ...
DQN and GAN
https://brightendavid.github.io/2025/10/14/%E6%95%B0%E5%AD%A6%E5%BC%8F%E6%95%B0%E5%AD%97%E5%8C%96/lglr
数学式数字化如拉格朗日计算可见上链接
DQN
DQN 就是deep
Q-learn,深度Q-learn。是在强化学习中引入网络结构的一个早期比较成功的案例。基于Q-Learn算法原理做的一个应用。
核心公式
[!NOTE]
这是TD算法,做参数最优化的工作
$$
q{\tiny t+1} = q_t + \alpha _t[ q_\pi-\hat{q}(s{\tiny t},a,w_t)))]
$$
[!NOTE]
这是引入了Q-Learn计算qπ,并对w参数向量求偏导
$$
w {\tiny t+1} = w_t + \alpha _t[ r{\tiny t+1} + \gamma
(max(\hat{q}(s{\tiny t+1},a,w_t)-\hat{q}(s{\tiny
t},a,w_t)))]\bigtriangle ...
warp
[TOC]
warp在不同python库函数中的实现
做深度水印工作有感,warp的代码还是挺难找的。主要使用的是仿射变换实现,否则不可微。
cv2
不知道,谁拿cv2塞到网络里面呀
12345678910111213141516171819w,h,_ = img.shapesrc_points = np.array([[165., 270.], [400., 270.], [360., 125.], [400., 125.]], dtype="float32")dst_points = np.array([[165., 270.], [400., 270.], [165., 30.], [400., 30.]], dtype="float32")M = cv2.getPerspectiveTransform(src_points, dst_points)M = np.linalg.inv(M)print(M)out_img = cv2.warpPerspective(img,M,(h,w))cv2.imshow("i ...
Hello World hexo!
Welcome to Hexo! This is your very
first post. Check documentation for
more info. If you get any problems when using Hexo, you can find the
answer in troubleshooting or
you can ask me on GitHub.
Quick Start
Create a new post
12$ hexo new "My New Post"$ hexo new "标题"
新建文章会自带文章属性名,就是文章最上面的title和标签一类
文章标题名称可以是中文,会显示Unicode编码
文章标题中可以出现空格,空格自动转为-
似乎会自动添加图片存放文件夹,在同目录下的同名文件夹下就是图片文件夹,注意在Typora中设置图片存放目录
More info: Writing
Run server
12$ hexo server$ hexo s
More info ...


