Az ember DNS-e óriási mennyiségű információt tartalmaz, amely körülbelül hárommilliárd bázispárba van belekódolva. Bár a DNS egyénenként változik, de csak kis mértékben: két tetszőleges ember genomja legalább 99,5 százalékban azonos, sőt ez az érték vérrokonsági viszonyban állók között még ennél is magasabb. Egy adott személy ma már a szekvenálásnak nevezett technika útján megismerheti a saját DNS-ének összetételét, azaz a genomját, amelyhez egy belőle származó mintára (mint például a száj nyálkahártyája) van pusztán szükség. Ez manapaság 1000 dollár körüli összegért elérhető szolgáltatás.
Ez persze nem jelenti azt, hogy önmagában ettől az információtól bárki okosabb lehet: az adatokat szükséges elemezni és összevetni az ismert eredményekkel. Vannak ugyanis olyan gének, amelyek jellemző változatai utalhatnak betegségekre való hajlamra vagy akár speciális ellenállóképességre. Például azok esetében, akiknek két példányuk is van az APOE4 génből (apai és anyai eredetű), hússzor magasabb az Alzheimer-kór kockázata (ez az emberek körül-belül 2 százalékát érinti). Vagy akiknek mutálódik a CCR5 génje, azok nagy valószínűséggel immunisak az AIDS-re (körülbelül 1 százalék érintett).
Azonban még sok felfedezésre váró terület van az emberi genom térképén, amely miatt még nem tudja teljes körűen kiaknázni a génszekvenálásban rejlő lehetőségeket az orvostudomány. Éppen ezen a területen kívánja előremozdítani a tudomány állását a Google Baseline Study nevű projektje, amely 175 egészséges ember genomját kívánja feltérképezni, illetve referenciaként használni a szervezetük kémiai háztartását. Így az egyes betegségek a tünetek előtt felismerhetőek lehetnek.
A kísérletben résztvevők számára azt ígérik, hogy az adatgyűjtés anonim lesz, és csak korlátozott hozzáférést adnak a későbbiekben a kutatóknak az elkészült adatbázishoz. Ez kellően körültekintőnek hangzik, azonban számos más vállalat, amely teljes genomszekvenálást vállal, egyben továbbértékesítéssel is foglalkozik. Nem csupán ez a gyakorlat aggályos, hanem számos adatvédelmi kérdés tisztázatlan ma még, mint például a genomszekvenciák tárolása, orvosokkal és kutatókkal való megosztása, elemzése kapcsán felmerülő további kérdések.
A DNS a tökéletes személyes azonosító. A DNS, mivel kizárólag az adott alanyra vonatkozó jellemzőket tartalmazza, ezért rendkívül pontos, időtálló azonosítóként is használható. Életünk során nem változik meg sohasem, így szemben a virtuális identitásokkal, nem visszavonható, nem cserélhető, ha napvilágra kerül. Ha csupán bizonyos részei lesznek ismertté, ez sem vonható vissza, idővel így is előbb-utóbb ismert lehet, és annak is fennáll a veszélye, hogy részletek napvilágra kerülése után beazonosítható a „tulajdonos”. Amerikai és izraeli kutatók már 2013-ban adtak példát arra, hogy név nélkül közzétett genomok hordozói nagy valószínűséggel beazonosíthatóak, így ezt az eljárást a genomika esetén nem biztonságos alkalmazni.
A genomok rendkívül érzékeny információkat hordoznak, ráadásul egy személy genomja több embert is közvetlenül érint. A visszafejtett genom előrejelzésekkel szolgálhat a várható egészségügyi kockázatokra vonatkozóan, és ez komoly visszaélésekre adhat okot. Például ha ez az információ egy biztosító kezébe kerül, lehetséges, hogy egyes szolgáltatásokat nem, vagy csak jelentősen drágábban kaphatunk meg. Vagy az is előfordulhat, hogy munkaadók válogatnak a jelentkezők között a génprofiljaik alapján. Ráadásul ez nem csak a genomot közzétevő személyre igaz: mivel vérrokonok között a genom 99,9 százalékban azonos, ők is nagyban érintettek. Éppen emiatt kérdéses, hogy a családtagok hozzájárulása nélkül etikus-e, hogy valaki nyilvánosságra hozza a genomját.
Érdekes kérdés a genomok tárolása is, hiszen ezek nagyméretű adatok (néhány gigabájt), amelyek biztonságos és privát tárolása nem triviális feladat, és bizonyára ezt az emberek többsége nem töltené fel az internetre (vagy a „felhőbe”), nem hagyná szívesen a szekvenálást végző cégnél (például a továbbértékesítéstől tartva), nem tartaná a mobilján, vagy épp nem bízná az államra. Ilyen hosszú távon is érzékeny, nagyméretű adatok titkosítása is tartalmaz bőven kihívásokat, hiszen a ma biztonságos módszerek 10, 20, 30 év múlva már idejétmúltak lehetnek.
Tekintve, hogy milyen érzékeny információ a genom, sosem érdemes egészében kiadni, még egy vizsgálat kedvéért sem. Egy érdekes példa erre Jim Watson esete (a DNS egyik felfedezője), aki a tudomány kedvéért közzétette a genomját, kivéve a Parkinson-kórra való hajlam megállapításánál használt géneket. Később azonban megmutatták, hogy az APOE4 gén tartalma statisztikailag kikövetkeztethető más génekből, így ez a „kitakarás” hasztalanná vált. Éppen ezért fontos olyan számítógépes algoritmusok kidolgozása, amely segítségével képesek lehetünk a genomunkból csupán a legszükségesebb részeket felfedni – ezekre a kérdésekre azonban a tudósok még éppen csak elkezdték keresni a válaszokat.