A Python and PyTorch developer, deep-learning worker and open-source activist.
Created by the awesome tool. 😊
- 📝 I regulary write articles on https://www.yuque.com/lart
- 💬 Ask me about Python, PyTorch in ISSUES
- ⚡ Fun fact I am a boy.
- ArXiv 2101 | Rethinking Interactive Image Segmentation Feature Space Annotation - Thu, 26 Jun 2025: 摘要 本文提出了一种创新的交互式图像分割方法,通过在特征空间进行批注操作来同时处理多幅图像。与传统在像素空间进行单幅图像标注的模式不同,该方法将用户交互转移到特征空间,显著减少了标注工作量。实验证明,该方法在前景分割数据集上达到state-of-the-art水平,在Cityscapes语义分割数据集上实现91.5%的准确率,标注效率提升74.75倍。该研究为图像分割标注提供了新思路,可与其他方法结合进一步提升标注效率。
- CVPR 2024 | Rethinking Inductive Biases for Surface Normal Estimation - Thu, 26 Jun 2025: 这篇论文重新思考了表面法线估计的归纳偏置问题,提出了创新性方法。作者指出现有基于通用密集预测模型的方法存在局限,进而提出三点改进:利用射向每个像素的射线方向作为输入,设计基于射线方向的激活函数,将法线估计重构为相对旋转估计。实验表明,该方法能生成更清晰平滑的预测结果,且在数据量较少时展现更强的泛化能力。该研究为从单RGB图像估计表面法线的任务提供了新思路,对三维重建等计算机视觉应用具有重要意义。
- CVPR 2024 | Rethinking the Up-Sampling Operations in CNN-based Generative Network for Generalizable - Thu, 26 Jun 2025: 本文研究了CNN生成网络中的上采样操作对深度伪造检测的影响,提出了基于邻近像素关系(NPR)的新型检测方法。研究发现上采样不仅产生频率域伪影,还会在像素级留下痕迹。NPR通过计算局部窗口内像素差值关系,有效捕捉图像细节中的生成痕迹。实验在包含28种生成模型的开放数据集上进行验证,NPR方法相比现有技术取得了11.6%的性能提升,展现出优秀的泛化能力。该方法通过训练二元分类器,利用NPR特征区分真实与合成图像,为深度伪造检测提供了新思路。
- 【译】Privacy-Enhancing Technologies in Biomedical Data Science - Thu, 26 Jun 2025: 在这篇综述中,我们专注于文献中最广泛研究的技术,包括同态加密(HE)、安全多方计算(MPC)、可信执行环境(TEE)、差分隐私(DP)和联邦学习(FL)。最近的进展极大地增加了这些技术在生物医学领域的适用性,正如我们在这篇综述中所说明的。与将 PETs 描述为解决生物医学数据共享挑战的潜在解决方案的现有综述(5-9)不同,我们专注于提供 PETs 最新进展的易于理解的总结,检查其技术基础和生物医学应用。
- 神经网络基础 | 给定条件下推导对应的卷积层参数 - Mon, 20 Jan 2025: 本文讨论了给定条件下卷积层参数的推导和代码。
- Transformer | 相对位置编码 - Sun, 19 Jan 2025: 相对位置编码现在已经被很多的视觉Transformer使用,也存在不同的实现形式。由于位置编码的本质就是将可学习变量或者是固定参数与特定的位置索引关联起来,所以实现的过程中会涉及到大量的坐标索引的变换,可读性很差。也因此不同形式的实现也存在着明显的差异。
- Hausdorff 距离 - Sat, 18 Jan 2025: 本文的内容主要围绕目标定位经典工作LocatingObjectsWithoutBoundingBoxes展开,着重于介绍HausdorffDistance相关的知识。
- Neuromorphic Computing | 基础知识 - Wed, 15 Jan 2025: 我们可以用充电、放电、重置,这 3 个离散方程来描述任意的离散脉冲神经元。
- ICLR 2024 - Spike-driven Transformer V2 - Meta Spiking Neural Network Architecture Inspiring the Des - Fri, 16 Aug 2024: 具体来说,本文将 NeurIPS 2023 发表的第一版工作中的脉冲驱动的 Transformer 扩展为元架构,并探索了结构、脉冲驱动自注意力和跳跃连接对其性能的影响。
- ArXiv 2405 | Rethinking Scanning Strategies with Vision Mamba in SemSeg of Remote Sensing Imagery - Fri, 17 May 2024: 这项研究对主流扫描方向及其组合对遥感图像语义分割的影响进行了全面的实验研究。通过在 LoveDA,ISPRS Potsdam 和 ISPRS Vaihingen 数据集上进行的广泛实验,我们证明,无论其复杂性或所涉及的扫描方向数量如何,都没有单一的扫描策略能胜过其他扫描策略。简单的单个扫描方向被认为足以对高分辨率遥感图像进行语义分割。 还建议了未来研究的相关方向。
View the archives @ csdn@p_lart.
Name | Stars | Description |
---|---|---|
Hands-on-Docker (中文) | 一份详尽的 Docker 使用指南。 | |
Awesome-Class-Activation-Map | An awesome list of papers and tools about the class activation map (CAM) technology. | |
PyTorchTricks | Some tricks of pytorch… | |
MethodsCmp | A Simple Toolkit for Counting the FLOPs/MACs, Parameters and FPS of Pytorch-based Methods. | |
PySODEvalToolkit | A Python-based salient object detection and video object segmentation evaluation toolbox. | |
PySODMetrics | A simple and efficient implementation of SOD metrcis. | |
PyLoss | Some loss functions for deeplearning. | |
OpticalFlowBasedVOS | A simple and efficient codebase for the optical flow based video object segmentation. | |
CoSaliencyProj | A project for co-saliency detection. Some codes are borrowed from ICNet. Thanks to ICNet Intra-saliency Correlation Network for Co-Saliency Detection (NIPS2020) | |
RunIt | A simple program scheduler for your code on different devices. | |
RegisterIt | Register it: A more flexible register for the DeepLearning project. | |
mssim.pytorch | A better pytorch-based implementation for the mean structural similarity. Differentiable simpler SSIM and MS-SSIM. | |
tta.pytorch | Test-Time Augmentation library for Pytorch. | |
YuQueTools | A simple tool to download your own articles from yuque. | |
ManageMyAttachments | Manage the attachments of your own obsidian vault. |