Help Center

Improved

Fixed

whisperit

Track reported bugs, missing features, UX friction, AI quality, and more

Backlog

Approved (created in Linear)

In Progress

Completed

Rejected

Communicated Rejection to User

Waiting

Communicated Completion to User

Reviewing

Prioritized

Ready for Linear

Feature

[Review] Backlog

[Review] Reviewing

[Review] Prioritized

[Review] Ready for Linear

[Planned] Approved in Linear

Done

FB: Cancelled

Customer Success / Dev Roadmap

Public Roadmap 

Hey {name|there}! 👋

ContextWhisperit currently has no mechanism to detect when a document already exists in the system, either at upload time or at AI processing time.This is a root cause of our quota crisis: the user delete entire folders (30-60 documents) and reprocess everything from scratch because they have no visibility on what is already indexed. Direct consequence: runaway upload + Azure processing costs, and the drastic quota measure taken two weeks ago.Scenario: a lawyer builds an AI context on ~100 case files, generates a summary, returns 20 days later to redo the task. In the meantime, 10-30 new files have arrived in their SharePoint. Today, the only safe option is to delete the whole folder and re-upload everything.ScopeTwo layers, shipped together:<ol><li>Upload layer — duplicate detection<ul><li>On upload, detect duplicates based on name + size + content hash.</li><li>Block silent duplication; surface explicit user choice: skip / replace / keep both (auto-rename).</li><li>Apply at single-file and bulk-upload entry points.</li></ul></li><li>AI layer — incremental context awareness<ul><li>When the user adds files to an existing folder/context, the AI must recognize which documents are already in its context.</li><li>Prompt the user: "I already have files X, Y, Z in this context. Integrate only the new ones (A, B, C) or rebuild from scratch?"</li><li>Process only deltas by default; full reprocess on explicit request.</li></ul></li></ol>Acceptance criteria<ul><li>Uploading a file already present in the folder triggers a duplicate dialog (skip / replace / keep both).</li><li>Hash-based detection works even if the file is renamed.</li><li>Adding files to a folder with an existing AI context only processes the new files unless the user opts for a full rebuild.</li><li>Telemetry: track duplicate-detection hits and reprocess-avoided events to measure cost impact.</li><li>Regression: existing single-file workflows are unaffected.</li></ul><img data-width="100%" data-align="left" alt="" data-featurebase-content-key="6908e7aafcf3a44036ceef35/post/6a0b3718d995a01f8e0e954a/019e3bce-eabf-7783-b4f8-dc7e0f9114e4/b64u-aW1hZ2UucG5n.png" data-featurebase-content-filename="image.png" src="https://6908e7aafcf3a44036ceef35.featurebase-attachments.com/c/post/6a0b3718d995a01f8e0e954a/019e3bce-eabf-7783-b4f8-dc7e0f9114e4/b64u-aW1hZ2UucG5n.png?X-Amz-Expires=3600&amp;X-Amz-Date=20260726T040000Z&amp;X-Amz-Algorithm=AWS4-HMAC-SHA256&amp;X-Amz-Credential=DO801TYC4FCVNNEKURKM%2F20260726%2Ffra1%2Fs3%2Faws4_request&amp;X-Amz-SignedHeaders=host&amp;X-Amz-Signature=ccedc10509b1230203066800ef1ff90d90aee231d85bbcf5792f979f4843ebd1">

ContexteWhisperit ne dispose actuellement d'aucun mécanisme permettant de détecter si un document existe déjà dans le système, que ce soit au moment du téléchargement ou lors du traitement par l'IA.C'est la cause principale de notre crise de quota : les utilisateurs suppriment des dossiers entiers (30 à 60 documents) et traitent tout à nouveau depuis le début, car ils n'ont aucune visibilité sur ce qui est déjà indexé. Conséquence directe : des coûts de téléchargement et de traitement Azure qui s'envolent, et la mesure drastique prise il y a deux semaines concernant les quotas.Scénario : un avocat crée un contexte IA sur environ 100 dossiers, génère un résumé, puis revient 20 jours plus tard pour refaire la tâche. Entre-temps, 10 à 30 nouveaux fichiers sont arrivés dans son SharePoint. Aujourd’hui, la seule option sûre consiste à supprimer l’intégralité du dossier et à tout télécharger à nouveau.PortéeDeux couches, livrées ensemble :<ol><li>Couche de téléchargement — détection des doublons<ul><li>Lors du téléchargement, détecter les doublons en fonction du nom, de la taille et du hachage du contenu.</li><li>Empêcher la duplication silencieuse ; proposer un choix explicite à l'utilisateur : ignorer / remplacer / conserver les deux (renommer automatiquement).</li><li>Appliquer aux points d'entrée de téléchargement de fichier unique et de téléchargement groupé.</li></ul></li><li>Couche IA — prise en compte incrémentielle du contexte<ul><li>Lorsque l'utilisateur ajoute des fichiers à un dossier/contexte existant, l'IA doit reconnaître quels documents se trouvent déjà dans ce contexte.</li><li>Demander à l'utilisateur : « J'ai déjà les fichiers X, Y, Z dans ce contexte. Intégrer uniquement les nouveaux (A, B, C) ou tout reconstruire à partir de zéro ? »</li><li>Traiter uniquement les différences par défaut ; retraiter l'ensemble sur demande explicite.</li></ul></li></ol>Critères d'acceptation<ul><li>Le téléchargement d'un fichier déjà présent dans le dossier déclenche une boîte de dialogue de doublon (ignorer / remplacer / conserver les deux).</li><li>La détection basée sur le hachage fonctionne même si le fichier est renommé.</li><li>L'ajout de fichiers à un dossier avec un contexte IA existant ne traite que les nouveaux fichiers, sauf si l'utilisateur opte pour une reconstruction complète.</li><li>Télémétrie : suivre les détections de doublons et les événements de retraitement évités pour mesurer l'impact sur les coûts.</li><li>Régression : les workflows existants à fichier unique ne sont pas affectés.</li></ul><img data-width="100%" data-align="left" alt="" data-featurebase-content-key="6908e7aafcf3a44036ceef35/post/6a0b3718d995a01f8e0e954a/019e3bce-eabf-7783-b4f8-dc7e0f9114e4/b64u-aW1hZ2UucG5n.png" data-featurebase-content-filename="image.png" src="https://6908e7aafcf3a44036ceef35.featurebase-attachments.com/c/post/6a0b3718d995a01f8e0e954a/019e3bce-eabf-7783-b4f8-dc7e0f9114e4/b64u-aW1hZ2UucG5n.png?X-Amz-Expires=3600&amp;X-Amz-Date=20260726T040000Z&amp;X-Amz-Algorithm=AWS4-HMAC-SHA256&amp;X-Amz-Credential=DO801TYC4FCVNNEKURKM%2F20260726%2Ffra1%2Fs3%2Faws4_request&amp;X-Amz-SignedHeaders=host&amp;X-Amz-Signature=ccedc10509b1230203066800ef1ff90d90aee231d85bbcf5792f979f4843ebd1">

Cas : Détecter les fichiers existants lors du téléchargement et éviter un nouveau traitement par l'IA

Case: Detect existing files at upload & avoid AI reprocessing

hidden

Whisperit

Case: Detect existing files at upload & avoid AI reprocessing

Subscribe to post

Subscribe to post