Ugrás a tartalomhoz

A kvantumkémia alapjai és alkalmazása

Veszprémi Tamás, Fehér Miklós

Educatio Társadalmi Szolgáltató Nonprofit Kft.

8.6. A sűrűségfunkcionál-elmélet alapjai

8.6. A sűrűségfunkcionál-elmélet alapjai

A Hohenberg–Kohn-tétel lehetővé teszi, hogy a hullámfüggvényen alapuló számításokat olyan módszerrel váltsuk fel, melynek alapja az elektronsűrűség. E módszer a sűrűségfunkcionál elmélet (density functional theory, DFT), mely a 90-es években igen nagy népszerűségre tett szert viszonylag csekély számításigénye és meglepően jó eredményei miatt.

A DFT módszer fő kérdése az, hogy adott részecskeszám mellett hogyan számítható az alapállapot sűrűsége, ha az elektronokra ható külső potenciált ismerjük. Figyelmünk középpontjában most az elektronok eloszlása áll. Amíg eddig egy molekulát úgy építettünk fel, hogy a térben elhelyezett, rögzített atommagokra „ráhúztuk” az elektronfelhőt, most megfordítjuk a képet. Először az n elektronból álló felhőt képzeljük el, majd ebbe az „elektrongázba” merítjük a magokat. Ezek hatását az elektrongázra, mint külső potenciált tekintjük, és e szerint csoportosítjuk a rendszer egyes kölcsönhatásait is.

Írjuk fel az energia várható értékét, mint a sűrűség funkcionálját!

A mag–mag taszítást, melynek értéke konstans, a további tárgyalásból „kifelejtjük”.

A Vne külső potenciál Vne[ρ] energia-járuléka (4.15) alapján a sűrűséggel kifejezhető. Felhasználva, hogy mindegyik elektronra ugyanaz a v(r) külső potenciál hat, kapjuk a

formulát és ennek alapján a

kifejezést. Az energiafunkcionál ezzel a következő alakba írható:

ahol a most bevezetett

ún. Hohenberg-Kohn-funkcionál a külső potenciáltól független, és kizárólag a részecskeszámtól függ, ezért adott részecskeszám mellett univerzális mennyiség, azaz tekintet nélkül a molekula típusára mindig ugyanaz. Az F[ρ] két részből áll, a kinetikus energia-funkcionálból, valamint az elektrontaszítási funkcionálból. Ez utóbbi is két tagot tartalmaz, egy klasszikus elektrontaszítási, és egy nem-klasszikus kicserélődési tagot, melyekkel már találkoztunk a Hartree–Fock-energia kifejezésben.

A sűrűség meghatározásának lehetőségét a második Hohenberg–Kohn-tétel nyújtja. E szerint létezik egy EHK[ρ] energiafunkcionál, melyre igaz, hogy ha ρ0(r) az adott rendszer alapállapotának a sűrűsége, és E0 az alapállapot energiája, akkor E[ρ]>E0 bármely ρρ0 „próba”-sűrűségre, és E[ρ0]=E0.

Variációs probléma előtt állunk tehát, keressük a (8.27) energiafunkcionál minimumát a részecskeszám állandóságát előíró (8.4) mellékfeltétel alkalmazása mellett:

melyből a

egyenletek adódnak (ahol a Lagrange-multiplikátor). Az – egyébként egzakt – megoldás egyetlen, de sajnos áthághatatlan akadálya, hogy az EHK[ρ]-ban szereplő F[ρ]-t nem ismerjük. Ha sikerülne F[ρ]-ra valamilyen használható formulát nyerni, az eljárás máris alkalmazható lenne. Mi több, mivel F univerzális, az eljárás bármely n-elektronos rendszerre alkalmazható lenne. A T[ρ] egzaktul számítható, nehézség csak a Vee[ρ]-val lehet, melyre csupán közelítő formulákat ismerünk.

A probléma áthidalására Kohn és Sham fejlesztettek ki egy szellemes eljárást, mely a DFT-módszert lehetőségből a szigorú számítások praktikus eszközévé változtatta.

Képzeljünk el egy olyan „nem kölcsönható” referencia rendszert, melyben nincs az elektronok között semmilyen kölcsönhatás, és melynek az alapállapotához tartozó sűrűsége ennek ellenére pontosan olyan, mint a kölcsönható rendszeré. (A Hohenberg–Kohn-tételből következően nyilván a külső potenciál más, mint az eredeti rendszerben.) Az ilyen rendszer Schrödinger-egyenlete – lévén az elektronok közötti zűrös kölcsönhatást kilőttük – automatikusan szétesik egyelektronos egyenletekre és ezért a hullámfüggvényét egy determináns-hullámfüggvény immár nem közelítőleg, hanem pontosan leírja. A determinánsban szereplő egyelektronos hullámfüggvényekkel pedig a sűrűség kifejezhető:

Ebben a rendszerben az egzakt kinetikus energiafunkcionál a következő alakú:

Természetesen ez nem a kölcsönható rendszer pontos kinetikus energiafunkcionálja, de sebaj, használjuk helyette (annál is inkább, mert nem sokban tér el az igazitól), és az

különbséget (mely tartalmazza az elektronkorreláció egy részét) vonjuk össze a kicserélődési résszel:

ahol most J[ρ] jelenti a Vee-ből a klasszikus Coulomb-tagot, Exc pedig az ún. kicserélődési-korrelációs funkcionál. Ezáltal a (8.30) feladat így módosul:

ahol

és melyben vcoul az elektronok közötti Coulomb potenciált, vxc a kicserélődési és korrelációs potenciált jelképezi. A Ts[ρ] tehát számítható, J[ρ] sűrűségfüggése a klasszikus elektrosztatikából ismert:

most már „csak” Exc-t kellene meghatározni. Mindazonáltal a feladat ebben az irányban nem egyszerűsödött. Jóval egyszerűbbé lesz azonban, ha másként kérdezünk: Hogyan kell megválasztani a φi egyelektronos függvényeket, hogy az energia várható értéke minimális legyen? Minthogy veff egyelektronos, a variációs elv alapján következik:

Lám, milyen ismerős szerkezet! Hát még ha elvégezzük az ilyenkor szinte kötelező (6.6)-tal analóg hasonlósági transzformációt, melynek eredményképpen kapjuk a „kanonikus” Kohn–Sham-egyenleteket:

Mintha csak egy Hartree–Fock-számításról lenne szó. Csupán az SCF iterációs sémát kell elővennünk és a módszer már működik is. Micsoda szerencse, még programozni sem szükséges: a régóta működő Hartree–Fock-programok minimális változtatással használhatók! Lám, máris megtaláltuk a DFT-módszerek óriási népszerűségének egyik okát.

Valóban, a formai hasonlóság a HF-egyenletekkel tökéletes. A tartalom azonban alapvetően más. A veff potenciál egyszerű szorzó operátor, a HF-egyenletekben szereplő pedig egy bonyolult integráloperátor. Ellentétben a HF-egyenletekkel, a (8.38) egzakt, semmilyen közelítést sem tartalmaz, és egyenértékű (8.34)-gyel. Azt is mondhatjuk, hogy a Hartree–Fock-elmélet a sűrűségfunkcionál elmélet egy olyan speciális esete, melyben az Exc-ből a korrelációs tagot elhagyjuk, a kicserélődési tagot pedig a cserélődési integrállal helyettesítjük. A (8.38) egyenletet az SCF módszer szerint kezelhetjük, tehát iteratív úton kapjuk az optimális Kohn–Sham-pályákat. A Kohn–Sham-pályákhoz semmilyen fizikai kép sem rendelhető, sőt – a HF módszerrel ellentétben – még a belőlük szerkesztett determinánshoz sem!9 Az egyedüli mennyiség, melynek fizikai értelme van, az elektronsűrűség, melyet viszont a Kohn–Sham-pályákból számíthatunk (8.31) szerint. Ha a sűrűséget már ismerjük, a rendszer energiája (8.24) alapján könnyen kifejezhető:

Látható, hogy a DFT-számítások elterjedésének és népszerűségének egyik oka az SCF-formalizmus alkalmazhatósága. Persze a népszerűséghez az is szükséges, hogy a módszer jó eredményeket szolgáltasson. Legfájóbb pontunk az Exc kicserélődési-korrelációs funkcionál, melyet továbbra sem ismerünk, és amelynek minél jobb becslésén áll, vagy bukik a módszer.

Első közelítésben kipróbálhatjuk, hogy mit kapunk, ha a teljes Exc funkcionált elhagyjuk. Ekkor jutunk a Thomas és Fermi által vizsgált modellhez, mely végtelen számú elektron esetén valóban pontos, molekuláris rendszerekre azonban nem használható. Az így számított sűrűség a végtelenben nem tűnik el, az atommagokban (r=0) pedig értéke végtelen. Ennél jobb közelítésre van szükségünk.

Válasszuk szét az Exc funkcionált egy kicserélődési és egy korrelációs részre:

Az Ex[ρ] kicserélődési funkcionál egzakt alakját homogén elektrongázra Dirac már 1930-ban levezette:

Ezt a formulát – mely természetesen a valóságos rendszer kicserélődési funkcionálját csak közelíti – használjuk az ún. lokális sűrűség közelítésen (local density approximation, LDA) alapuló módszerekben. (Nyílt héjú rendszerekben, amikor az α és β elektronok sűrűsége nem azonos, az eljárást lokális spinsűrűség-közelítésnek – local spin density approximation, LSDA – nevezzük.) Amennyiben a korrelációs tagot elhagyjuk, nyerjük a Slater és Gáspár által kidolgozott Xα módszert, melyet a 70-es években elsősorban a szilárdtestfizikában elterjedten használtak. A korrelációs tag számítására Vosko, Wilk és Nusair dolgozott ki egy sorozat, az LSD közelítésen alapuló funkcionált. Ezeket általában VWN-funkcionáloknak nevezik.

Az LSD közelítésen alapuló funkcionálok használata egyszerű, eredményességük azonban kérdéses. Az elektronsűrűség természetesen nem homogén, az inhomogenitásokat valahogy figyelembe kell venni. Ennek legegyszerűbb módja az ha a funkcionált formálisan sorbafejtjük a sűrűség szerint. Más szavakkal, figyelembe vesszük a funkcionáloknak nemcsak ρ-tól való függését, hanem azok deriváltjaitól, ρ-tól, 2ρ,...-tól való függését is. Az így származtatott formulákat nemlokális, vagy gradienssel korrigált funkcionáloknak nevezzük.

Az első gradienssel korrigált kicserélődési funkcionált a 80-as években dolgozták ki. A mára már számos ismert változat közül talán a Becke által 1988-ban kidolgozott formula a legismertebb:

melyben b egy empírikusan illesztett paraméter és x tartalmazza az elektronsűrűség gradiensét:

Könnyen belátható, hogy amennyiben a gradiens eltűnik, (8.40) az LSDA közelítéshez tart. Hasonló kifejezést javasolt Perdew és Wang 1986-ban (PW86), melyben három empírikus paraméter gondoskodik a formula megfelelő működéséről.

Az utóbbi években számos gradienssel korrigált korrelációs funkcionált is kidolgoztak, melyek közül a legnépszerűbbek a Lee, Yang és Parr (LYP), a Perdew (P88) és a Perdew és Wang (PW91) által kifejlesztett formulák. Ezek nem túl bonyolult de meglehetősen nagy helyigényű képletek, ezért eltekintünk a bemutatásuktól.

Az egyelektronos modellben a HF módszer egzakt formulát ad a kicserélési funkcionál számítására. Ha tehát egy nem kölcsönható rendszert tekintünk (melyben nincs elektronkorreláció), a Kohn–Sham-pályákból alkotott determináns hullámfüggvény a rendszer egzakt sajátfüggvénye, a kicserélődési energia pedig a HF-elmélet alapján pontosan számítható. Ez az alapja a hibrid módszereknek melyekben Exc számítására a HF kicserélődési és a DFT kicserélődési-korrelációs funkcionál valamilyen kombinációját alkalmazzák:

Megemlíthetjük pl. Becke három paraméteres hibrid funkcionálját melynek a felhasznált korrelációs funkcionál szerint különböző verziói ismeretesek, pl. az alábbi, mely a PW91 funkcionált tartalmazza:

vagy a ma talán legnépszerűbb B3LYP-módszert, mely a fentihez hasonló módon foglalja magában a Lee–Yang–Parr-funkcionált. A formulában használt c0, cx és cc mennyiségek a kísérleti ionizációs energiákhoz, proton affinitásokhoz és atomizációs energiákhoz illesztett empírikus állandók.

A fontosabb funkcionálokat ma már minden valamire való kvantumkémiai programcsomag tartalmazza, így használatukat semmi sem korlátozza. Az aktuális DFT számítást az alkalmazott bázison kívül éppen e funkcionálok használatával lehet specifikálni. Például a BLYP/6-31G* módszer Becke (8.40) funkcionálját használja a Lee, Yang és Parr-féle korrelációs funkcionállal, vagy a BP86/6-31G* módszerben a P88 korrelációs és a Becke-féle kicserélődési funkcionált kombinálják – mindkét esetben a 6-31G* bázis mellett.

A fentiek alapján a funkcionálok fejlesztési iránya jól nyomon követkető. Új funkcionálok keresgéléséhez persze a hullámfüggvény alapú módszerek is szóba jöhetnek. Egyre pontosabb új funkcionálokat pontos elektronsűrűségek segítségével lehet gyártani. Pl. egy CCSD(T) számításból nyert sűrűségből kiindulva keresünk egy sorozat olyan Kohn–Sham-orbitált, mely ugyanazt a sűrűséget adja és ebből próbálunk következtetni Exc-re.

Az utóbbi években a különböző funkcionálok pontosságát, használhatóságát és megbízhatóságát számos munkában tesztelték. A 8.2. táblázat egy ilyen vizsgálat eredményét mutatja, melyben különböző szénhidrogéneknek néhány jól ismert funkcionállal számított képződéshőit láthatjuk.10 Az eredmények alapján talán a B3LYP- és a BPW91 módszerek kicsivel jobbnak mutatkoznak a többinél, ám az eltérés egyik funkcionál esetén sem akkora, hogy – pusztán az ismertetett eredményekre támaszkodva – egyértelmű következtetést vonhassunk le.

 

8.2. táblázat. Számított + és mért képződéshők (kcal/mol-ban).

 

   

 S. J. Mole, X. Zhou, R. Liu, J. Phys. Chem., 100, 14665 (1996) alapján. 

+ B = Becke kicserélődési funkcionálja, B3 = Becke háromparaméteres hibrid funkcionálja, LYP = Lee–Yang–Parr-korrelációs funkcionál, PW91 = Perdew–Wang, korrelációs funkcionál, P86 = Perdew korrelációs funkcionál 1986-ból.

A DFT módszer ma már széles körben elfogadottá vált. Eredményei összemérhetők az MP2 eredményekkel, számítási időigénye a HF módszeréhez van közel. Mivel az elektronkorrelációt implicit módon magában foglalja, nincs szüksége az egydeterminánson túli determinánsokra, azaz virtuális pályákra. Ebből következően a bázis méretére nem annyira érzékeny, mint a magas szintű poszt-HF-számítások. Számítógépes algoritmusa a HF-módszerhez hasonlóan viszonylag egyszerűen lineárissá tehető a bázisfüggvények számával, ezáltal nagy rendszerek számítására – akár 1000 atomig – is alkalmasnak látszik. Természetesen számos hátrányt is tudomásul kell vennünk. A hullámfüggvényen alapuló módszerek használata során pontosan tudjuk, hogy milyen messze vagyunk az egzakt Schrödinger-egyenlet megoldásától, ezért a módszer hibája becsülhető, és azt is tudjuk, hogy milyen módon lehet a hibát csökkenteni. Az egzakt kicserélődési-korrelációs funkcionált nem ismerjük, és így azt sem tudhatjuk, hogy a gyakorlatban használt funkcionálok milyen távol vannak a valóditól. A DFT-módszerek megbízhatóságára tehát semmilyen elvi információnk nincs. Egy új funkcionál használhatóságát csakis a gyakorlat bizonyíthatja. Tudjuk, hogy a számítási igény a korrelációs energia minél pontosabb figyelembe vételével exponenciálisan nő. Ennek alapján az is elképzelhető, hogy a DFT-módszerek számítási igénye ugyanilyen mértékben nő az egyre pontosabb (és ezért egyre bonyolultabb) funkcionálokkal.

L. G. E. Scuseria, J. Phys. Chem. , 103 , 4782–4790 (1999).

Látjuk azt is, hogy az egyes funkcionálok empírikus paramétereket is tartalmaznak. Ezeket a paramétereket különböző kísérleti adatok segítségével állítják be. Felmerül ezért a kérdés, vajon a DFT ab initio módszer-e, avagy inkább sorolható a (9. fejezetben ismertetett) félempírikus módszerekhez? Amennyiben az „ab initio” megjelölés azt jelenti, hogy nem tartalmaz empírikus paramétereket, akkor (az LSDA kivételével) a DFT módszerek bizonyosan nem ab initio módszerek. Ám még ebben az esetben is feltétlenül érzékelnünk kell a különbséget a DFT és egy „valódi” félempírikus modell között. Például a 9. fejezetben részletezett PM3 modellben minden egyes atomhoz 18 empírikus paramétert rendelünk, amíg a DFT-funkcionálok legfeljebb 1-3 paramétert használnak – az egész periódusos rendszerre. Ha azonban az ab initio elnevezés azt jelenti, hogy elméletünk pusztán alapvető fizikai elvekből kiindulva elvileg képes az egzakt eredményt produkálni, a DFT-nek dukál a jelző, hiszen csupán csak arról van szó, hogy még nem ismerjük a pontos funkcionál alakját.

A fentiekből talán érzékelhető, hogy a DFT módszer és a hullámfüggvényen alapuló elmélet ugyanazon problémának két különböző megoldása. Logikus vágyálom, hogy próbáljuk a kettő előnyös tulajdonságait ötvözni a módszerek hibái nélkül. Erről szól az ún. ab 11 initio sűrűségfunkcionál-elmélet, amely jelenleg még kidolgozás alatt áll.